本帖最后由 fnaviwwo1 于 2016-7-4 00:59 编辑
我就是说说想法啦,希望能和您一同探讨可行性。
之前看到论坛里有大神做过国内考试真题的词典,感觉效果非常棒。
[取自考研英语真题]1997-2015年真题单词、词频、意思及其例句
也看到有大神做过新概念英语的词典。
[英-英] 新概念英语全文句库
简单词的问题,nltk有个stopwords列表,这些词不要
- >>> from nltk.corpus import stopwords
- >>> stopwords.words('english')
- ['i', 'me', 'my', 'myself', 'we', 'our', 'ours', 'ourselves', 'you', 'your', 'yours',
- 'yourself', 'yourselves', 'he', 'him', 'his', 'himself', 'she', 'her', 'hers',
- 'herself', 'it', 'its', 'itself', 'they', 'them', 'their', 'theirs', 'themselves',
- 'what', 'which', 'who', 'whom', 'this', 'that', 'these', 'those', 'am', 'is', 'are',
- 'was', 'were', 'be', 'been', 'being', 'have', 'has', 'had', 'having', 'do', 'does',
- 'did', 'doing', 'a', 'an', 'the', 'and', 'but', 'if', 'or', 'because', 'as', 'until',
- 'while', 'of', 'at', 'by', 'for', 'with', 'about', 'against', 'between', 'into',
- 'through', 'during', 'before', 'after', 'above', 'below', 'to', 'from', 'up', 'down',
- 'in', 'out', 'on', 'off', 'over', 'under', 'again', 'further', 'then', 'once', 'here',
- 'there', 'when', 'where', 'why', 'how', 'all', 'any', 'both', 'each', 'few', 'more',
- 'most', 'other', 'some', 'such', 'no', 'nor', 'not', 'only', 'own', 'same', 'so',
- 'than', 'too', 'very', 's', 't', 'can', 'will', 'just', 'don', 'should', 'now']
复制代码
关于词典的布局,因为特定于某一们考试,句子的数量虽然大但是还是很有限。
确实每个句子会有很多词(还包括词型变化),如果每个句子都放到他出现的单词下面会有很多冗余。
感觉可以设置很多不存在的词条来放句子,比如 id_0001->一个句子,这样子。
然后利用mdict的@@@link功能,句子里的每个单词都连接到句子,mdict会直接显示链接后的结果的。
这些冗余因为mdx是压缩保存的,我觉得重复的问题也不是不大。
通过不同的单词下重复若干经典例句,会给单词留下非常深刻的印象,个人感觉比直接背孤立单词(特别是释义很长的时候)有效果。
题外话:
新东方的有些单词书例句看着真不爽,感觉怪怪的。 |