查看: 983|回复: 4
打印 上一主题 下一主题

[教程] 给繁体词典添加简体索引的简单方法

[复制链接]
  • TA的每日心情
    开心
    2019-1-18 23:55
  • 签到天数: 230 天

    [LV.7]常住居民III

    72

    主题

    1027

    回帖

    11万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    117972

    QQ 章

    跳转到指定楼层
    1
    本帖最后由 dfliaoyue 于 2018-4-26 17:34 编辑

    因为发现一本排版很棒的台湾的国语词典(指的是一个台湾人做的教育部新编国语辞典第五版,论坛里有授权转载的),于是想加个简体索引便于查找。简单试了下,发现一个比较便捷的方法。
    1. 用置顶的mdict editor tools提取词条。
    2. 将提取的词条拷到excel里,用审阅工具的繁转简转换。
    3. 将词条列表在第二列再拷贝一遍。现在是第一列简体、第二列繁体。
    4. 将两列选中,拷进空白txt文档。
    5. 用正则多行替换,去掉繁简同体的。查找项为^(.*?)    \1$ 。不要直接拷贝我写的,把一行内容加个换行拷进去,再把前后词语换成^(.*?)和\1$ 。
    6. 现在,你已经得到了所有且不重复的简体繁体对应表了。用正则替换为mdict词典的格式即可。第一行是简体,第二行@@@LINK=繁体,第三行</>。注意不要有空行。
    7. 解包原mdx,把前面得到的文本拷贝到解包出来的源文件后面,同样注意不要有空行。
    8. 用mdxbuilder重新打包。注意编码格式。

    整套过程,由于现成工具多,最难的也仅仅是最基础的正则替换。注意像emedit的多行替换是需要选择多行模式的。

    P.S. 繁体汉语词典不建议把内容转成简体。百科就随意了。

    评分

    2

    查看全部评分

    本帖被以下淘专辑推荐:

  • TA的每日心情
    开心
    2023-1-18 23:24
  • 签到天数: 211 天

    [LV.7]常住居民III

    427

    主题

    4539

    回帖

    9万

    积分

    超级版主

    Rank: 12Rank: 12Rank: 12

    积分
    92011

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章城管大队长

    2
    发表于 2018-4-26 17:17:18 | 只看该作者
    @oversky台湾教育部国语词典
  • TA的每日心情
    无聊
    2022-9-25 21:09
  • 签到天数: 1136 天

    [LV.10]以坛为家III

    17

    主题

    3142

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    25289

    灌水大神章

    3
    发表于 2018-4-26 19:08:05 | 只看该作者
    kyletruman 发表于 2018-4-26 17:17
    @oversky台湾教育部国语词典

    了解了。谢谢。
  • TA的每日心情
    开心
    2018-6-30 07:01
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    3

    主题

    57

    回帖

    1155

    积分

    禁止发言

    积分
    1155
    4
    发表于 2018-6-24 14:23:39 | 只看该作者
    用GoldenDict的话,就简单了,直接设置繁简转换就可以了,不必修改词典本身。