查看: 422|回复: 3
打印 上一主题 下一主题

[求助] 新手问一个处理非mdict 源文本的问题

[复制链接]
  • TA的每日心情
    开心
    2018-4-26 16:40
  • 签到天数: 2 天

    [LV.1]初来乍到

    31

    主题

    236

    回帖

    6万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    63987

    灌水大神章

    跳转到指定楼层
    1
    发表于 2017-1-31 23:02:15 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    我之前发过外教社计算机百科词汇电子版(https://www.pdawiki.com/forum/thread-19710-1-1.html),想要自己制作mdx 版本,却发现使用calibre 转换的txt 明显不是mdict 源文本。

    自己一个一个的去编辑符合mdict原文本的格式显然不是明智的。我看到论坛里面有提到正则表达式的,是不是应该用正则表达式处理这个raw material ?如果是我应该怎么办?特此求教。

    该用户从未签到

    123

    主题

    1719

    回帖

    3万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    30382

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    2
    发表于 2017-2-1 18:33:31 | 只看该作者
    是 去学习正则 掌握基本即可
  • TA的每日心情
    开心
    2018-8-15 07:35
  • 签到天数: 22 天

    [LV.4]偶尔看看III

    2

    主题

    880

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    16296

    灌水大神章

    3
    发表于 2017-2-1 21:46:32 | 只看该作者
    用calibre转换成txt是不行的,要转换成epub格式。

    epub格式其实就是个压缩包,解压之后就是html格式。

    最后再用正则表达式替换这些html文件。

    网上有个《正则表达式30分钟入门教程》看完即可操作了。

    支持正则表达式的文本编辑软件推荐PowerGREP、EditPadPro、EmEditor。
  • TA的每日心情
    开心
    2022-3-11 16:40
  • 签到天数: 10 天

    [LV.3]偶尔看看II

    37

    主题

    411

    回帖

    1360

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    1360

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    4
    发表于 2017-2-2 03:55:07 | 只看该作者