查看: 683|回复: 3
打印 上一主题 下一主题

[求助] 如何只提取词条标题和模块化词典

[复制链接]

该用户从未签到

23

主题

63

回帖

250

积分

童生

Rank: 2

积分
250
跳转到指定楼层
1
发表于 2014-8-28 13:18:41 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 wubis 于 2014-8-28 16:57 编辑

比如说我想写honor这个单词,但是忘记了拼写对不对,或者要用美式的
把各大词典的词条标题提取出来就行了

各位有方法吗 我有mdxbuilder convstar getdict
我想过把mdx转成stardict 再研究idx文件,发现好像是二进制,所以就没法了。

模块化是我自己想的词语,语文不好

高级汉语词典mdx里面作者合成了部首查询,而我getdict后发现不用网页编辑软件要提取这个部首查询有点难度,所以一直很想提取个部首。

最近折腾汉典的chm,拼音查询已经提取了,我的设计是这样的:(以下均为输入查询的语句)
拼音总目录--> pytree (tree表示目录应该挺好的)
直接进入ma子页 --> py:ma
直接进入“妈”字 -->妈

我的意思是造轮子,比如把这些部首、拼音模块blabla提取出来,然后用一个共用的接口,就像win32 API一样(本人不懂编程,比喻以下),这样子其他词典作者可以合成到他的mdx里面去。也可以用联合查询、多词典查询的方式。

各位有何高见

拼音部首单独词典已经弄好了,看这https://www.pdawiki.com/forum/thread-12998-1-1.html
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    29

    主题

    553

    回帖

    5307

    积分

    版主

    Rank: 10Rank: 10Rank: 10

    积分
    5307

    灌水大神章小蜜蜂章笑傲江湖章管理组专用章

    2
    发表于 2014-8-28 15:39:28 | 只看该作者
    汉典已经有mdx文件了 加上拼音索引就可以了

    该用户从未签到

    23

    主题

    63

    回帖

    250

    积分

    童生

    Rank: 2

    积分
    250
    3
     楼主| 发表于 2014-8-28 16:49:52 | 只看该作者
    ldlcau 发表于 2014-8-28 15:39
    汉典已经有mdx文件了 加上拼音索引就可以了

    不好意思,但我不明白你是什么意思,拼音和部首的索引单独制成词典我已经发布了
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    29

    主题

    553

    回帖

    5307

    积分

    版主

    Rank: 10Rank: 10Rank: 10

    积分
    5307

    灌水大神章小蜜蜂章笑傲江湖章管理组专用章

    4
    发表于 2014-8-28 23:03:36 | 只看该作者
    本帖最后由 ldlcau 于 2014-8-28 23:13 编辑
    wubis 发表于 2014-8-28 16:49
    不好意思,但我不明白你是什么意思,拼音和部首的索引单独制成词典我已经发布了


    我们是不是两个世界的,我说的有些我也看不懂
    论坛里的中文汉语词典基本都带检索的
    汉典:
    http://pan.baidu.com/s/1gd5oaL9