查看: 913|回复: 10
打印 上一主题 下一主题

[工具] 快速制作MDX图片版词典代码分享

[复制链接]
  • TA的每日心情
    开心
    2020-11-30 19:14
  • 签到天数: 249 天

    [LV.8]以坛为家I

    15

    主题

    325

    回帖

    6万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    60114
    跳转到指定楼层
    1
    发表于 2016-3-15 23:21:48 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 DIC4Khmer 于 2016-3-16 21:03 编辑

      经过几天的Python学习,自己也可以写一些小代码了。考虑到很多像我一样刚入门的朋友,最开始是希望能够拥有自己所需的一本词典。最初词典不需要太美观,首先要解决“无”的问题,要先能用,毕竟对我们来说,有,总聊胜于无的。但是苦于没有时间去钻研技术,或者在一些小问题上久久不得其解,最终都达不到初衷。所以,为了帮助这些朋友能够快速地达成初衷,我把自己最近学习所得的小代码分享给大家,希望能解大家之所急,同时更希望大家能够积极地钻研技术,为本论坛的繁荣作贡献。
    源格式:

    源代码:

    输出结果:

    词典样式:


    本帖被以下淘专辑推荐:

    该用户从未签到

    5

    主题

    485

    回帖

    2385

    积分

    解元

    Rank: 5Rank: 5

    积分
    2385

    灌水大神章小蜜蜂章笑傲江湖章

    2
    发表于 2016-3-16 05:23:29 | 只看该作者
    老大,看汪清楚呀。文本格式的最好的了。
  • TA的每日心情
    慵懒
    2023-1-10 21:48
  • 签到天数: 802 天

    [LV.10]以坛为家III

    3

    主题

    2373

    回帖

    2万

    积分

    禁止发言

    积分
    20562

    小蜜蜂章笑傲江湖章灌水大神章

    4
    发表于 2016-3-17 22:46:58 来自手机 | 只看该作者
    不错,有机会试一试

    该用户从未签到

    38

    主题

    655

    回帖

    7509

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    7509

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    5
    发表于 2016-3-19 15:04:02 | 只看该作者
    这是上心的
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    99

    主题

    1477

    回帖

    3万

    积分

    翰林院孔目

    Rank: 10Rank: 10Rank: 10

    积分
    35504

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    7
    发表于 2016-3-21 13:41:09 | 只看该作者
    感谢分享!

    楼主能具体分享下具体的制作步骤吗?
  • TA的每日心情
    开心
    2020-11-30 19:14
  • 签到天数: 249 天

    [LV.8]以坛为家I

    15

    主题

    325

    回帖

    6万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    60114
    8
     楼主| 发表于 2016-3-21 20:14:11 | 只看该作者
    liuyunrushui 发表于 2016-3-21 13:41
    感谢分享!

    楼主能具体分享下具体的制作步骤吗?

    您是指字典的制作过程吗?
    我的源文件是PDF,首先使用软件将PDF转换为JPG,每一页就是一个JPG文件,将全部JPG文件整理好后放到同一个文件夹下,方便后续Mdxbuilder调用。然后手动将每一页的词条录入word(小语种还没有有效的OCR)中,每一页全部录到同一行,字典一般为双栏,将左栏最后一词与右栏第一词用“/”隔开,其余词之间用“|”隔开。当然分隔符可以自己修改。全部录入完成后,将文件另存为UTF-8无签名的dict.txt文件,与图中的Python代码放在同一个目录下,然后运行python代码就能在该目录下获得字典的源mdx格式码了。使用mdxbuilder,Data选择刚才的JPG文件存放位置,就可以直接将mdx码生成为MDX字典了。若有其他需要,可直接在代码上进行修改。

    该用户从未签到

    0

    主题

    28

    回帖

    51

    积分

    童生

    Rank: 2

    积分
    51
    9
    发表于 2016-3-21 20:36:25 | 只看该作者
    不错,有机会试一试
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    99

    主题

    1477

    回帖

    3万

    积分

    翰林院孔目

    Rank: 10Rank: 10Rank: 10

    积分
    35504

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    10
    发表于 2016-3-22 07:51:41 | 只看该作者
    DIC4Khmer 发表于 2016-3-21 20:14
    您是指字典的制作过程吗?
    我的源文件是PDF,首先使用软件将PDF转换为JPG,每一页就是一个JPG文件,将全 ...

    多谢您的具体指导!

    过几天试试手看看!多谢多谢!
  • TA的每日心情
    无聊
    2019-1-29 19:23
  • 签到天数: 1 天

    [LV.1]初来乍到

    1

    主题

    30

    回帖

    186

    积分

    童生

    Rank: 2

    积分
    186
    11
    发表于 2019-11-4 18:54:58 | 只看该作者
    请问代码在哪里??图片太模糊看不清