查看: 1366|回复: 3
打印 上一主题 下一主题

[讨论] 合并懒虫简明词典和一本“简明英汉汉英”的体验

[复制链接]

该用户从未签到

23

主题

63

回帖

250

积分

童生

Rank: 2

积分
250
跳转到指定楼层
1
发表于 2014-10-4 15:24:35 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
原本的体积  懒虫 13m 另一本简明(superfan)的 30m (两本都是我自己删除了大量标签,仅保留加粗的)。然后我分别把两本的</>结尾改成“<br>懒虫简明\n</>"和<br>简明英汉汉英\n</>” 然后用cat合并,确认合并开始的地方没有错后然后就自然交给mdxbuilder了。

惊喜之旅开始了

一、在导入文本和sorting dict时,我1g的内存快爆了,让我看住任务管理器准备着kill掉mdxbuilder。幸好顺利编译,词条数1723707,也不是很多啊,而且每条的内容也不多。回想起之前编译精简版的金山快译词库,词条数很多(忘记有多少了),mdxbuilder花了很长时间。应该3.0 beta2也是大文件特别版吧?

二、mdict的隐藏功能(高手无视)
我不太相信那个相同词头的词条合并,但是上述的混合物放到mdict 的PC和 安卓端都不能同时显示两个词典的解释,也就是说,在单词典模式下,那个mdict 神奇的iframe(或者是框架什么的,?)不会跳出来。
怎么办呢

在pc端,新建一个空分组,只放进那个混合物,然后把分组标记为联合模式,马上显示了同一个mdx内的不同词条
在安卓端,大同小异,在多词典模式下只选择那个混合物,也马上显示了同一个mdx内的不同词条。

不管怎样,我还是第一次发现这个功能啊,如果那个regex dotx不是很会用的话,也可以走这个路

三、那个混合物的mdx是33.5mb,也就是说,我觉得尽可能把一些相似的词典做成像我说的那个混合物或者直接词条合并...mdx的压缩仅比7z格式大15%~30%,对于有索引的数据库应该压缩效率挺不错吧。

###
其实我这样做是因为mdict下多词典模式的来来回回勾选各本词典很麻烦,比如查中文时和查英文时,有些中文词典有英文词条,却又占了一大片屏幕。seederdict有自由分组功能,如果rayman有时间可以改进一下。而且单个mdx复制和搬来搬去也方便一点^-^
  • TA的每日心情

    2018-6-16 00:08
  • 签到天数: 197 天

    [LV.7]常住居民III

    16

    主题

    1663

    回帖

    6575

    积分

    禁止发言

    积分
    6575

    小蜜蜂章笑傲江湖章灌水大神章

    2
    发表于 2014-10-10 12:46:35 | 只看该作者
    坛友,分享一个才是王道哈。
  • TA的每日心情
    奋斗
    2020-8-24 01:04
  • 签到天数: 153 天

    [LV.7]常住居民III

    1

    主题

    235

    回帖

    5447

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    5447
    3
    发表于 2019-12-25 13:36:52 | 只看该作者
    分享一下呗
  • TA的每日心情
    开心
    2021-9-18 15:22
  • 签到天数: 272 天

    [LV.8]以坛为家I

    0

    主题

    364

    回帖

    3964

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3964
    4
    发表于 2020-1-18 07:50:55 | 只看该作者

    谢谢l大,准备考研结束后就折腾折腾