查看: 1170|回复: 7
打印 上一主题 下一主题

[学习求助] 有没有批量查词输出的工具?

[复制链接]
  • TA的每日心情
    开心
    2022-9-20 10:49
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    3

    主题

    75

    回帖

    437

    积分

    秀才

    Rank: 3Rank: 3

    积分
    437
    跳转到指定楼层
    1
    发表于 2010-11-25 11:39:14 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    mdict 上这么多这么好的资源,只作为查词用,太局限了。

    我想这样使用mdict 资源。

    比如,某人现在准备4级考试,要攻克单词。找来了一张4级大纲的词汇表。
    表中有5000个单词,txt文件,每个单词占一行。
    在软件中指定这个词汇表,再指定一个词库 (比如牛津高阶),
    然后选择输出格式(比如word),
    之后,我就会得到一个 4级词汇范围的牛津词典,打印出来,可以身带着背单词了。

    不知是不是我火星了,这样的功能是否现在已有方法能实现?

    该用户从未签到

    17

    主题

    139

    回帖

    976

    积分

    举人

    Rank: 4

    积分
    976
    2
    发表于 2010-11-25 11:51:14 | 只看该作者
    这个需要自己写代码实现了
  • TA的每日心情
    开心
    2022-9-20 10:49
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    3

    主题

    75

    回帖

    437

    积分

    秀才

    Rank: 3Rank: 3

    积分
    437
    3
     楼主| 发表于 2010-11-25 12:00:39 | 只看该作者
    写哪个部分的代码?
    可能我说输出成word,举例不太合适。
    输出成html 呢,内容部分不需要转换。
    其他步骤是不是比较简单了?

    该用户从未签到

    17

    主题

    139

    回帖

    976

    积分

    举人

    Rank: 4

    积分
    976
    4
    发表于 2010-11-25 17:19:17 | 只看该作者
    步骤如下:
    1、按照HTTP://home.ustc.edu.cn/~wchao911/tool.html中所述方法导出你想要的mdx词库中的内容,假设导出文件为out.html。
    2、准备你想要的5000个单词,每个单词一行。
    3、循环遍历5000个单词,对每个单词去out.html中查找,若找到,写到输出文件中。
    4、Over!
  • TA的每日心情
    开心
    2022-10-10 09:12
  • 签到天数: 202 天

    [LV.7]常住居民III

    21

    主题

    1143

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15589

    灌水大神章小蜜蜂章笑傲江湖章

    5
    发表于 2010-11-25 21:15:49 | 只看该作者
    本帖最后由 yru 于 2010-11-25 21:19 编辑

    估计这样你自己很快就可以编写出一大本几乎可以超越所有词典的好词典了,呵呵
    我觉得可能性很小,很多词典的txt文件都大于200M
    还有,要过某个考试,完全用不着把所有词典的解释和例句都记熟吧
  • TA的每日心情
    开心
    2022-9-20 10:49
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    3

    主题

    75

    回帖

    437

    积分

    秀才

    Rank: 3Rank: 3

    积分
    437
    6
     楼主| 发表于 2010-11-26 12:06:36 | 只看该作者
    我的想法就是建立一个数据库, 集中多本词典,每个字典用一个数据表。可以慢慢增加,遇到好的资源就加入。词条释义部分采用mdict html 格式存储,以后如有变化,容易转换。
    主要满足的是浏览阅读需要,而不是查询。
    所以,使用方式不是整体用于手持设备,
    而是按需输出,生成一定范围的新mdict词典,当作单词卡片看,或者纸面打印出来。比如,输出4级词汇的牛津,GRE 词汇的MW collegiate。 变态用法, 来个牛津keyword 范围的OED,打印出来每天看{:3_55:}
    甚至组合输出,比如GRE 词汇的MW collegiate + 简明英汉。

    该用户从未签到

    7

    主题

    88

    回帖

    474

    积分

    秀才

    Rank: 3Rank: 3

    积分
    474
    7
    发表于 2011-2-27 19:46:37 | 只看该作者
    是个好建议,支持。应该有人能做出来的。

    该用户从未签到

    131

    主题

    535

    回帖

    2826

    积分

    解元

    Rank: 5Rank: 5

    积分
    2826

    笑傲江湖章灌水大神章

    8
    发表于 2011-2-27 23:05:22 | 只看该作者
    如果MDX词库是未加密的,直接可以利用R大提供的工具导出为文本。
    如果MDX词库是加密的,涉及到作者的版权,我们也不建议公开去讨论。