查看: 300|回复: 8
打印 上一主题 下一主题

[讨论] 是否有办法恢复词条的原始排序

[复制链接]
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    73

    主题

    1552

    回帖

    9万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    96973

    QQ 章笑傲江湖章灌水大神章推广专家

    跳转到指定楼层
    1
    发表于 2020-7-14 08:03:43 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    这是原始的源文件,排序是乱序 53412:

    1. 5
    2. 5
    3. </>
    4. 3
    5. 3
    6. </>
    7. 4
    8. 4
    9. </>
    10. 1
    11. 1
    12. </>
    13. 2
    14. 2
    15. </>
    复制代码


    但一旦用MdxBuilder编译为mdx,并用MdxExport将这个mdx导出为txt后,其顺序就变成升序12345了:

    1. 1
    2. 1
    3. </>
    4. 2
    5. 2
    6. </>
    7. 3
    8. 3
    9. </>
    10. 4
    11. 4
    12. </>
    13. 5
    14. 5
    15. </>
    复制代码

    鉴于原始词条的排序信息对某些词典很重要,请教:mdx中是否还保留有原始词条的排序信息?如果包含有原始的排序信息,如何才能导出为带有原始排序的源文件?

  • TA的每日心情
    开心
    2019-1-18 23:55
  • 签到天数: 230 天

    [LV.7]常住居民III

    72

    主题

    1027

    回帖

    11万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    117972

    QQ 章

    2
    发表于 2020-7-14 08:43:21 | 只看该作者
    我记得这么捣腾不会改顺序的呀?

    点评

    这是错觉。  发表于 2020-7-14 09:16
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    73

    主题

    1552

    回帖

    9万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    96973

    QQ 章笑傲江湖章灌水大神章推广专家

    3
     楼主| 发表于 2020-7-14 09:19:47 | 只看该作者
    dfliaoyue 发表于 2020-7-14 08:43
    我记得这么捣腾不会改顺序的呀?

    欢迎继续捣腾实验

    案例文件.zip (900 Bytes, 下载次数: 0)

    该用户从未签到

    539

    主题

    3046

    回帖

    25万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    251476

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    4
    发表于 2020-7-14 09:56:43 | 只看该作者
    不行,mdx的格式设计的时候就是照unicode的顺序排

    这么设计有好有坏,不过对汉语类词典而言,最大的好处就是做好以后,一眼能看出某些问题(乱码、异常符号)

  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    73

    主题

    1552

    回帖

    9万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    96973

    QQ 章笑傲江湖章灌水大神章推广专家

    5
     楼主| 发表于 2020-7-14 10:26:38 | 只看该作者
    klwo2 发表于 2020-7-14 09:56
    不行,mdx的格式设计的时候就是照unicode的顺序排

    这么设计有好有坏,不过对汉语类词典而言,最大的好处就 ...

    感谢答疑!

    该用户从未签到

    50

    主题

    620

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    12280

    灌水大神章小蜜蜂章笑傲江湖章

    6
    发表于 2020-7-14 11:22:43 | 只看该作者
    序列有价值的词典,制作时就加上序号,将来还原就容易了
  • TA的每日心情
    慵懒
    2022-12-12 17:17
  • 签到天数: 228 天

    [LV.7]常住居民III

    0

    主题

    227

    回帖

    1165

    积分

    解元

    Rank: 5Rank: 5

    积分
    1165
    7
    发表于 2020-7-14 12:25:27 | 只看该作者
    保留原始文件,每次修改在原始数据上面改了再打包,我一般不相信可逆性
  • TA的每日心情
    开心
    2022-1-31 08:58
  • 签到天数: 252 天

    [LV.8]以坛为家I

    8

    主题

    367

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    18941
    8
    发表于 2020-7-15 08:25:48 | 只看该作者
    我只用过Mac下的打包工具,writemdict.py这个文件中,在生成mdx的时候,函数_build_offset_table中会对key进行排序。windows下mdxbuilder是否有类似的python代码,你可以看一下。我的理解是注释掉排序代码应该就可以实现你的要求。