查看: 419|回复: 6
打印 上一主题 下一主题

[求助] 请问如何把一个mdx里面的词头提取出来?

[复制链接]
  • TA的每日心情
    开心
    2021-7-23 18:04
  • 签到天数: 48 天

    [LV.5]常住居民I

    8

    主题

    63

    回帖

    3754

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3754
    跳转到指定楼层
    1
    发表于 2021-2-14 22:23:00 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    各位好,第一次提问,要是问得太低级还请大家见谅啊。
  • TA的每日心情

    2023-1-4 19:34
  • 签到天数: 304 天

    [LV.8]以坛为家I

    32

    主题

    613

    回帖

    6万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    60799

    QQ 章

    推荐
    发表于 2021-2-16 11:05:26 | 只看该作者
    打開goldendict,點擊詞典選項,點擊詞典選項,選中你要提取的字典,右鍵,詞典詞條,導出,完事
  • TA的每日心情
    开心
    2019-8-21 08:44
  • 签到天数: 163 天

    [LV.7]常住居民III

    17

    主题

    393

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    14980
    推荐
    发表于 2021-2-15 16:15:20 | 只看该作者
    有python环境的话,试试 readmdict包

    安装
    1. pip install readmdict
    复制代码


    使用
    1. from readmdict import MDX

    2. filename = "some.mdx"
    3. headwords = [*MDX(filename)]
    4. print(headwods[:10])  # fisrt 10 in bytes format
    5. for hdw in headwods[:10]:
    6.         print(hdw.decode())   # fisrt 10 in string format
    复制代码

    评分

    1

    查看全部评分

  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    推荐
    发表于 2021-2-15 01:05:44 | 只看该作者
    本帖最后由 喬治兄 于 2021-2-15 01:07 编辑

    若是僅僅是詞頭,直接在 golden dictionary 匯出既可,此不需太複雜的操作
  • TA的每日心情
    开心
    2023-1-18 23:24
  • 签到天数: 211 天

    [LV.7]常住居民III

    427

    主题

    4539

    回帖

    9万

    积分

    超级版主

    Rank: 12Rank: 12Rank: 12

    积分
    92011

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章城管大队长

    推荐
    发表于 2021-2-15 00:44:56 | 只看该作者
    置顶帖:Dict Source Editor【2014.08.24】
    https://www.pdawiki.com/forum/fo ... hread&tid=12972
    (出处: 掌上百科 - PDAWIKI)
  • TA的每日心情
    开心
    2021-7-23 18:04
  • 签到天数: 48 天

    [LV.5]常住居民I

    8

    主题

    63

    回帖

    3754

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3754
    6
     楼主| 发表于 2021-2-16 12:16:14 | 只看该作者
    好的谢谢各位
  • TA的每日心情
    开心
    2022-7-9 09:17
  • 签到天数: 1 天

    [LV.1]初来乍到

    1

    主题

    32

    回帖

    129

    积分

    童生

    Rank: 2

    积分
    129
    7
    发表于 2022-8-3 16:01:27 | 只看该作者
    在吗楼主,我有个想法,把不同版本词头提取出来,然后对比筛选,可以把新增加的词汇搞出来啊,哈哈,不知道我这个想法可不可行。。