查看: 1300|回复: 4
打印 上一主题 下一主题

[教程] 我的第一本切图版词典制作,感谢C大!

[复制链接]
  • TA的每日心情
    开心
    2020-11-30 19:14
  • 签到天数: 249 天

    [LV.8]以坛为家I

    15

    主题

    325

    回帖

    6万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    60114
    跳转到指定楼层
    1
    发表于 2017-5-24 21:06:47 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 DIC4Khmer 于 2017-5-25 22:12 编辑

      一年多以前我开始接触MDict,慢慢养成逛论坛的习惯,没事儿打开看看。学习学习那些做得美观的词典,一直希望能够做本自己业内的词典,但因为没有经验,一直以C大@chigre3为榜样,并且各种问C大问题。感谢C大有问必答,还分享自己的软件给我,这也是我能够做成第一本切图词典的重要原因。开此贴,一则感谢C大。二则分享一样我制作词典的小经验。
    我主要分三步进行:
    一、获取数据图片
    这本词典我做了一个多月,从(1)最开始买扫描仪拆书扫描,到(2)制作模板校直微调图片,到(3)统一调整图片大小,(4)统一调色去阴影等,前后就花了几周。(PS:以上小步骤,论坛里都有教程)最后导出所有图片备用。
    二、处理数据图片
    第二步的终极目标是获得令人满意的切图文件。我是利用C大的软件,打开上一步初步处理的图片,经过(1)划线、(2)导入词条并校对、(3)去除特殊页的上下空白、(4)切图,获得词条与图片名的对应信息和单个切图文件、(5)批处理调整切图图片大小、优化切图文化等,这些工作又花了几周,最后才得以获取到勉强让人满意的切图文件。
    三、制作源数据,并生成MDX
    前两步,其实都是对源数据的操作,这可能是最难的部分,最为耗时耗力,并且又不能马虎大意,不然环环相扣,后期可能会出现各种问题。第三步,其实最为简单,我只花了两天,并且仅仅通过应用正则表达式以及Excel进行源数据的制作,按照自己的想法进行数据的处理。我的切图字典里所用的都是置顶教程里那些最基础的格式语法,因为目前我还不会CSS,所以不是很漂亮。生成源数据时,我的基本思路是,(1)获取词条与切图图片的对应关系,完成图片调用。(2)制作前五个相邻词与后五个相邻词的链接(这个相对复杂,不过结合Excel,多用几次正则替换也就解决了。)。这个步骤我遇到了一些问题,这里与大家分享一下,希望后来者不要再吃亏。我是先制作某词条与其前五个相邻词的MDX格式数据,然后制作其与后五个相邻词的MDX格式数据,最后将两部分数据整合到一个文件中,利用排序功能,使同一个词的前五个相邻词数据与后五个相邻词数据能够紧挨一起,这样方便使用正则进行替换,使其合二为一。问题就出在这里,后来第一次成品出来以后,我发现某些词的相邻词信息出现了错乱,经查是Emeditor的排序功能并不能使我这个语言的相同词条的信息完全上下紧挨排列,比如我希望的排列顺序是AABBCCDD,而Emeditor排出来的却是AABCBCDD。所以后面替换时就出现了大问题。希望大家注意一下。后面我是把数据拷贝到Excel中排序,然后又拷回到Emeditor中进行正则替换的,这样才解决了问题。(3)添加最上方的体例说明等信息。这个最简单,写好后,利用正则,在所有词条对应信息的最前面加上这部分即可。(4)最终调整为MDX的格式数据,并生成MDX数据。
    以上是我的三大步工作,其实做好以后,还需要导入MDict中并检查是否有错误,然后再回溯检查是前面具体哪个步骤出的问题,发现一些问题,回到该步骤,修改后重新生成MDX,反复几次,直至没有错误或者基本没有错误。
    以上是个人的制作过程,欢迎大家批评指正。
  • TA的每日心情
    郁闷
    2018-5-17 09:15
  • 签到天数: 1 天

    [LV.1]初来乍到

    56

    主题

    490

    回帖

    1万

    积分

    分区版主

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    12730

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    2
    发表于 2017-5-25 16:34:55 | 只看该作者
    这本是泰语字典?切图字典优点是错误相对少,体积大,及好像在手机上不能随意放大及缩小。
  • TA的每日心情
    开心
    2020-11-30 19:14
  • 签到天数: 249 天

    [LV.8]以坛为家I

    15

    主题

    325

    回帖

    6万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    60114
    3
     楼主| 发表于 2017-5-25 22:14:42 | 只看该作者
    y8888 发表于 2017-5-25 16:34
    这本是泰语字典?切图字典优点是错误相对少,体积大,及好像在手机上不能随意放大及缩小。

    是柬语字典。做切图字典主要是因为没有电子数据,手机上需要调整图片大小后重新生成MDX才比较好用。

    该用户从未签到

    123

    主题

    1719

    回帖

    3万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    30382

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    4
    发表于 2017-5-27 01:12:42 | 只看该作者
    恩,怎么说呢,看了帖子,觉得你走了不少弯路。。。
    不过过程就是学习!谢谢分享经验!
  • TA的每日心情
    开心
    2020-11-30 19:14
  • 签到天数: 249 天

    [LV.8]以坛为家I

    15

    主题

    325

    回帖

    6万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    60114
    5
     楼主| 发表于 2017-5-27 07:08:04 | 只看该作者
    chigre3 发表于 2017-5-27 01:12
    恩,怎么说呢,看了帖子,觉得你走了不少弯路。。。
    不过过程就是学习!谢谢分享经验!

    我也觉得走了弯路,不然怎么会要这么麻烦。不过能做出来,还是很高兴的,谢谢C大帮助啊!