TA的每日心情 | 开心 2020-11-30 19:14 |
---|
签到天数: 249 天 [LV.8]以坛为家I
状元
- 积分
- 60114
|
本帖最后由 DIC4Khmer 于 2017-5-25 22:12 编辑
一年多以前我开始接触MDict,慢慢养成逛论坛的习惯,没事儿打开看看。学习学习那些做得美观的词典,一直希望能够做本自己业内的词典,但因为没有经验,一直以C大@chigre3为榜样,并且各种问C大问题。感谢C大有问必答,还分享自己的软件给我,这也是我能够做成第一本切图词典的重要原因。开此贴,一则感谢C大。二则分享一样我制作词典的小经验。
我主要分三步进行:
一、获取数据图片
这本词典我做了一个多月,从(1)最开始买扫描仪拆书扫描,到(2)制作模板校直微调图片,到(3)统一调整图片大小,(4)统一调色去阴影等,前后就花了几周。(PS:以上小步骤,论坛里都有教程)最后导出所有图片备用。
二、处理数据图片
第二步的终极目标是获得令人满意的切图文件。我是利用C大的软件,打开上一步初步处理的图片,经过(1)划线、(2)导入词条并校对、(3)去除特殊页的上下空白、(4)切图,获得词条与图片名的对应信息和单个切图文件、(5)批处理调整切图图片大小、优化切图文化等,这些工作又花了几周,最后才得以获取到勉强让人满意的切图文件。
三、制作源数据,并生成MDX
前两步,其实都是对源数据的操作,这可能是最难的部分,最为耗时耗力,并且又不能马虎大意,不然环环相扣,后期可能会出现各种问题。第三步,其实最为简单,我只花了两天,并且仅仅通过应用正则表达式以及Excel进行源数据的制作,按照自己的想法进行数据的处理。我的切图字典里所用的都是置顶教程里那些最基础的格式语法,因为目前我还不会CSS,所以不是很漂亮。生成源数据时,我的基本思路是,(1)获取词条与切图图片的对应关系,完成图片调用。(2)制作前五个相邻词与后五个相邻词的链接(这个相对复杂,不过结合Excel,多用几次正则替换也就解决了。)。这个步骤我遇到了一些问题,这里与大家分享一下,希望后来者不要再吃亏。我是先制作某词条与其前五个相邻词的MDX格式数据,然后制作其与后五个相邻词的MDX格式数据,最后将两部分数据整合到一个文件中,利用排序功能,使同一个词的前五个相邻词数据与后五个相邻词数据能够紧挨一起,这样方便使用正则进行替换,使其合二为一。问题就出在这里,后来第一次成品出来以后,我发现某些词的相邻词信息出现了错乱,经查是Emeditor的排序功能并不能使我这个语言的相同词条的信息完全上下紧挨排列,比如我希望的排列顺序是AABBCCDD,而Emeditor排出来的却是AABCBCDD。所以后面替换时就出现了大问题。希望大家注意一下。后面我是把数据拷贝到Excel中排序,然后又拷回到Emeditor中进行正则替换的,这样才解决了问题。(3)添加最上方的体例说明等信息。这个最简单,写好后,利用正则,在所有词条对应信息的最前面加上这部分即可。(4)最终调整为MDX的格式数据,并生成MDX数据。
以上是我的三大步工作,其实做好以后,还需要导入MDict中并检查是否有错误,然后再回溯检查是前面具体哪个步骤出的问题,发现一些问题,回到该步骤,修改后重新生成MDX,反复几次,直至没有错误或者基本没有错误。
以上是个人的制作过程,欢迎大家批评指正。 |
|