查看: 2417|回复: 4
打印 上一主题 下一主题

[汉汉] mdx源/stardict/文本格式3合1 (附康熙字典)

[复制链接]
  • TA的每日心情
    擦汗
    前天 07:00
  • 签到天数: 1090 天

    [LV.10]以坛为家III

    124

    主题

    1772

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10477

    灌水大神章小蜜蜂章笑傲江湖章

    跳转到指定楼层
    1
    发表于 2014-8-29 13:53:06 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    stardict的dict格式本身为文本文件,而其文本内部格式可采纳mdx源文件格式。
    采纳此格式以后发现30M以内的词典用sed查询可瞬时反馈,根本不需要任何词典软件。

    附上康熙字典,转自
    https://www.pdawiki.com/forum/thread-12999-1-1.html

    附件请将后缀改为.xz.不用解压,无穷多的软件可直接处理xz文件,譬如xzless,xzgrep.
    注:为方便我本人,</>标记暂改为####. 想转回mdx源格式的话只需简单替换回即可。

    kangxi.rar

    2.72 MB, 下载次数: 93, 下载积分: 米 -5 粒

    评分

    1

    查看全部评分

  • TA的每日心情
    擦汗
    前天 07:00
  • 签到天数: 1090 天

    [LV.10]以坛为家III

    124

    主题

    1772

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10477

    灌水大神章小蜜蜂章笑傲江湖章

    2
     楼主| 发表于 2014-8-29 14:08:15 | 只看该作者
    基本上只有OED,汉语大词典,大英百科才有必要用stardict程序查询。

    另所有的文本文件合集也可用类似方法整理。我目前将所有文本文件tar以后用xz压缩。基本上xz格式大小为mdx的一半左右,全文模糊检索或更高级的功能实在是小菜。

    该用户从未签到

    15

    主题

    137

    回帖

    2342

    积分

    解元

    Rank: 5Rank: 5

    积分
    2342

    灌水大神章小蜜蜂章笑傲江湖章

    3
    发表于 2014-8-29 21:49:58 | 只看该作者
    学一下,如何用sed查询。
  • TA的每日心情
    擦汗
    前天 07:00
  • 签到天数: 1090 天

    [LV.10]以坛为家III

    124

    主题

    1772

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10477

    灌水大神章小蜜蜂章笑傲江湖章

    4
     楼主| 发表于 2014-8-29 22:06:03 | 只看该作者
    本帖最后由 spoony1971 于 2014-8-30 05:13 编辑
    qunwang6 发表于 2014-8-29 21:49
    学一下,如何用sed查询。


    sed -n '/^####word/,/^####/p‘
    可写成script

    该用户从未签到

    16

    主题

    1074

    回帖

    3万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    31794

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    5
    发表于 2014-8-30 13:38:15 来自手机 | 只看该作者
    sed是啥?