查看: 3221|回复: 2
打印 上一主题 下一主题

[索引] mdx转txt文本源码的四种方法

[复制链接]
  • TA的每日心情

    2021-10-23 19:58
  • 签到天数: 212 天

    [LV.7]常住居民III

    3

    主题

    461

    回帖

    1952

    积分

    解元

    Rank: 5Rank: 5

    积分
    1952
    跳转到指定楼层
    1
    发表于 2020-1-28 00:21:46 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 lemonlab 于 2020-1-28 03:46 编辑

    一、[[2018-3-3]MdxExport3.5-MDX与MDD资源导出小工具。](https://www.pdawiki.com/forum/thread-17709-1-1.html)
        知道的人最多的老牌工具啦,据说是GetDict2_6的升级版

    二、[[1.0.9] PatchO8C repacked - Extract MDX/MDD ](https://www.pdawiki.com/forum/fo ... 8848&extra=page%3D1)
    1. 3. 以 BIG5 编码时,最好手动选 CP950 或是香港的 BIG5HKSCS。用 Python 的 BIG5 会少几个字,例如你说的「裏」。当字典編码是 BIG5 时,可以两种解码 CP950 或 BIG5HKSCS 都试试看,这些当年都统称 BIG5,结果会不太一样。
    2. 4. 新增 Decoding error 的处理方式。 之前 Crash 或转不出来都是解码的问题,有些是 Python 的限制。
    3.     a. Ignore: 直接把解不出来的字删除。
    4.     b. Replace: 把解不出来的字以�替换。所以解出来後要注意查找这个字,再和原版比较校对。
    5.     c. Strict: 这就是之前的模式。一报错,马上就停止执行

    6. 1.0.9 2016.11.29 unescape
    7. 按单词表包含或排除提取到粘贴板
    8. note:
    9. hit ESC 3 times 按{Esc}三次有扩展功能,加载单词表,按Open打开txt,csv逗号分隔文件
    10. all: paste from csv: (^[^\n]+)\n(.+)\n(</>)$,,\1\2\3  
    11. key: paste from csv: (^[^\n]+)\n(.+)\n(</>)$,,\1      提取词头
    12. definition: paste from csv: (^[^\n]+)\n(.+)\n(</>)$,,\2    仅仅提取定义
    复制代码


    三、pyglossary  [pyglossary 词典格式转换 ](https://www.pdawiki.com/forum/fo ... &tid=37718&ctid=514)
        全能手,能在多种词典源文件格式之间转换,很强大,不过要安装python3,
        有窗口界面,运行 run-Tkinter-based interface.bat
    四、[Dict Source Editor【2014.08.24】](https://www.pdawiki.com/forum/fo ... mp;extra=#pid178848)
      Export-Custom可以按照自己的需求导出指定的词条文本。例如只导出自己需要的某些词条,或者不导出某些词条。只需将你需要导出的词条保存到一个文本文件,每个词条一行,然后指定这个文件即可。

    [mdict-utils mdict 打包解包工具 ](https://www.pdawiki.com/forum/thread-33808-1-1.html)
        个人测试用不起来,命令行提示找不到模块

    另外还有几个用python来读取mdx的,玩anki的时候经常遇到
      1,mdict_reader
      2,mdx-server
      3,flask-mdict

    在转出txt源文件后,Mdict Editor Tool v2.0.35  -- 多功能个性化词典制作工具
    这工具按自定义单词表提取很好使

    [xwang / mdict-analysis — Bitbucket](https://bitbucket.org/xwang/mdict-analysis/src/default/)如果谈到最有贡献达到当然是mdict的作者R大,和goldendict的俄罗斯大侠
    除此之外还有一位也是不能被忘记的就是 [xwang / mdict-analysis — Bitbucket](https://bitbucket.org/xwang/mdict-analysis/src/default/)
    mdx格式的解密者,如果没有解密,mdx无法被更多词典壳体支持,金鱼和欧路估计也难有今天的影响力
    印证了一个规律,一个有影响力的工具必须得和chrome,python沾点边

    最后一并感谢所有这些默默奉献的大神


    评分

    2

    查看全部评分

  • TA的每日心情
    擦汗
    2023-2-4 10:31
  • 签到天数: 302 天

    [LV.8]以坛为家I

    3

    主题

    983

    回帖

    6万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    67284

    QQ 章

    QQ
    2
    发表于 2020-1-28 13:07:54 | 只看该作者
    谢谢楼主分享精品文章

    该用户从未签到

    0

    主题

    15

    回帖

    38

    积分

    白身

    Rank: 1

    积分
    38
    3
    发表于 2023-2-16 01:17:45 | 只看该作者
    Mdict Editor Tool 可以将txt转为mdx, 我得学学