查看: 1015|回复: 13
打印 上一主题 下一主题

[求助] 求助,如何把词典中不要的单词删除?

[复制链接]
  • TA的每日心情
    开心
    2018-5-27 05:26
  • 签到天数: 55 天

    [LV.5]常住居民I

    22

    主题

    388

    回帖

    4358

    积分

    被盗用户

    积分
    4358
    跳转到指定楼层
    1
    发表于 2018-3-17 14:33:09 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
    我想把LDAE3或5这部带例句发音的词汇只保留COCA5000词汇。这样方便大量去听这5000个词的例句发音,熟悉搭配。
  • TA的每日心情
    开心
    昨天 19:36
  • 签到天数: 624 天

    [LV.9]以坛为家II

    539

    主题

    1981

    回帖

    5万

    积分

    超级版主

    Rank: 12Rank: 12Rank: 12

    积分
    53357

    翰林院专用章推广专家灌水大神章笑傲江湖章小蜜蜂章管理组专用章QQ 章

    2
    发表于 2018-3-17 15:06:56 | 只看该作者
    本帖最后由 孤影 于 2018-3-17 16:47 编辑

    这个应该需要编程吧
  • TA的每日心情
    奋斗
    2021-4-4 16:28
  • 签到天数: 353 天

    [LV.8]以坛为家I

    6

    主题

    555

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10889

    QQ 章

    3
    发表于 2018-4-5 18:44:40 来自手机 | 只看该作者
    其实论坛里有按照单词表提取词典内容的工具,但是处理大量单词时会报错,开发者也没有解决。。
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    15

    主题

    336

    回帖

    15万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    153139

    灌水大神章小蜜蜂章笑傲江湖章推广专家QQ 章

    4
    发表于 2018-4-5 23:49:37 | 只看该作者
    这个写一个 Python 小程序应该可以实现,我测试好了发一下,有这个需求的朋友应该不少。
  • TA的每日心情
    开心
    2018-5-27 05:26
  • 签到天数: 55 天

    [LV.5]常住居民I

    22

    主题

    388

    回帖

    4358

    积分

    被盗用户

    积分
    4358
    5
     楼主| 发表于 2018-4-6 15:34:32 | 只看该作者
    Snowdax: 谢谢你,我原来的愿望是按词典出现的顺序把例句音频提出来合并为一个mp3. 在论坛上找了许多工具能提取音频,但排序令人非常头疼。我手工对了5000千词的A和B部分(LAAD3)
  • TA的每日心情
    开心
    2018-5-27 05:26
  • 签到天数: 55 天

    [LV.5]常住居民I

    22

    主题

    388

    回帖

    4358

    积分

    被盗用户

    积分
    4358
    6
     楼主| 发表于 2018-4-6 15:37:21 | 只看该作者
    Snowdax: 谢谢你,我原来的愿望是按词典出现的顺序把例句音频提出来合并为一个mp3. 在论坛上找了许多工具能提取音频,但排序令人非常头疼。我手工对了5000千词的A和B部分(LAAD3),工作量巨大,而且有错误。
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    15

    主题

    336

    回帖

    15万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    153139

    灌水大神章小蜜蜂章笑傲江湖章推广专家QQ 章

    7
    发表于 2018-4-6 21:12:14 | 只看该作者
    本帖最后由 Snowdax 于 2018-4-6 21:16 编辑
    nidetou 发表于 2018-4-6 15:37
    Snowdax: 谢谢你,我原来的愿望是按词典出现的顺序把例句音频提出来合并为一个mp3. 在论坛上找了许多工具能 ...


    目前我的水平编出的程序运行速度还很慢,我用解压后源文件约100MB的Macmillan词典测试了一下,单词列表中有81个单词,平均每个单词要2.5秒。如果是5000个单词的COCA列表,大概需要3.5个小时。
    可在 https://github.com/Snowdax/customiseMdxFromList 下载 .exe 文件,这个直接在 Windows 上就能用,不用搭建 Python 环境,而且程序里面集成了 COCA5000 的单词表。最后生成可用于 MdxBuilder 的文件,单词个数可能会少于 5000,因为 COCA5000 列表里可能有一些词库中没有的单词,比如 n't
    详细的使用说明和个性化设置我稍后会补充到 GitHub 上,并在论坛另开一帖与大家讨论。

    评分

    1

    查看全部评分

    该用户从未签到

    0

    主题

    3

    回帖

    9

    积分

    童生

    Rank: 2

    积分
    9
    8
    发表于 2018-4-6 22:46:47 | 只看该作者
    学习了,有没有能适合小白的方法啊
  • TA的每日心情
    开心
    2018-5-27 05:26
  • 签到天数: 55 天

    [LV.5]常住居民I

    22

    主题

    388

    回帖

    4358

    积分

    被盗用户

    积分
    4358
    9
     楼主| 发表于 2018-4-7 03:14:53 | 只看该作者
    已打赏,谢谢。
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    15

    主题

    336

    回帖

    15万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    153139

    灌水大神章小蜜蜂章笑傲江湖章推广专家QQ 章

    10
    发表于 2018-4-7 21:42:20 | 只看该作者
    nidetou 发表于 2018-4-7 03:14
    已打赏,谢谢。

    谢谢!我更新了一下使用说明,你可以看一下这里
    https://github.com/Snowdax/customiseMdxFromList#windows-用户使用指南
    目前该程序的性能可能无法在短时间内得到较大提升。
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    15

    主题

    336

    回帖

    15万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    153139

    灌水大神章小蜜蜂章笑傲江湖章推广专家QQ 章

    11
    发表于 2018-4-9 00:42:45 | 只看该作者
    我目前在测试升级版的程序,会快很多。我用这个帖子的 LAAD3 和 LDAE5 测试了一下。发现我的程序并不适合于这两个词典,还需要做一些调整,因为这两个词典不是三行一个单词,而多了一行!<link type="text/css" rel="stylesheet" href="LAAD3.css"/>
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    15

    主题

    336

    回帖

    15万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    153139

    灌水大神章小蜜蜂章笑傲江湖章推广专家QQ 章

    12
    发表于 2018-4-9 11:52:15 | 只看该作者


    LAAD3_3_customised_COCA5000.zip (5.74 MB, 下载次数: 7)

    LDAE5_3_customised_COCA5000.zip (2.99 MB, 下载次数: 6)

  • TA的每日心情
    开心
    2018-5-27 05:26
  • 签到天数: 55 天

    [LV.5]常住居民I

    22

    主题

    388

    回帖

    4358

    积分

    被盗用户

    积分
    4358
    13
     楼主| 发表于 2018-4-10 00:22:10 | 只看该作者

    能否分别针对LAAD3和LDAE5做COCA5000-10000和COCA10000-20000的文件?谢谢!!!!
  • TA的每日心情
    开心
    2018-5-12 15:02
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    10

    主题

    91

    回帖

    11万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    111301
    14
    发表于 2018-4-10 01:40:37 | 只看该作者
    其实下面这个帖子里的提供的程序就很好用了,作者的教程又图文并茂,很容易懂。
    Dict Source Editor【2014.08.24】
    https://www.pdawiki.com/forum/fo ... &fromuid=129113
    (出处: 掌上百科)