|
7楼
楼主 |
发表于 2016-1-26 14:03:50
|
只看该作者
本帖最后由 LYX1692 于 2016-1-26 14:09 编辑
喬治兄:
当然,我也明白,光有那几千基础词汇,读篇英文新闻都会读不下去。
词汇量总归是越多越好。
为什么还想要弄这么一个基础词汇的例句库呢?
因为这些基础词汇大有可为,我想提取出来,看看他们究竟能有多大作为。
其实,要做这么一个句库,词典本不是理想的对象,毕竟词典收纳单词的,大量词汇是超出基础的。
我以前统计过《哈利波特》的词汇量,连小说人名、地名一起算在内,第1部总用词是4300多,第2部是5200多。
《哈利波特》一共7部,总字数是112万多。总词汇量是15500左右。
使用频率上排名前3000的词汇,占字106万。
在这一共15500左右的词汇中,其中4841个词汇在这7部书里只出现过一次。
于是,我就想,假设给我这些词汇,也不需要我自己创作,简单到对着中文来翻译英文,我跟原著能有多大差异?
这种差别的原因所在,不是原书用了哪一个我不知道的单词,恰巧体现在某些单词,我明明很熟悉,却用不出来。
有些句子,我抓破头也想不出怎么翻译,一看英文,就是中学词汇而已。
当然,也还有中英思维方式的差异,对语法的掌握程序等因素,我也不否认。
于是,我就想,回归基础。
我想很多人跟我一样,不会用英文表达,不是因为我们词汇量不足,而是一些基础词汇不会灵活运用。
至于你说到,建个3000词的词表就好了。
其实我知道这么做。以前也发过一个词频词典,包含朗文当代高阶第5版列出的3000核心词,牛津的3000核心词, 麦克米伦词典2500释义词汇, VOA慢速英语1500基础词汇, 英国国家语料库5000高频词, 当代美国英语语料库5000高频词汇。
我现在想要提取只包含这些词的例句,更多是想弄成电子书放到Kindle上阅读。
以中文为主,弹出英文注脚。
这种样式,我以前也发布过资源。
其实这个帖子算是已解决。
写了个Javascript脚本,已大致实现。
但是技术有限,希望大神能有更好的办法。
以后我有小孩了,我就给他/她弄一个。
Ta读初三,我就给Ta提取一个初三版,读高三,我就给ta给高三版,让Ta知道,哪怕只有这个年级英语词汇量,也可以这么表达。
|
|