本帖最后由 tkuguy 于 2020-2-19 13:08 编辑
最近花了一些时间研究了一下英英辞典在词频标示方面的资料,在这里和大家分享一下。
首先我们都知道初学者在挑英英字典时,一般都会挑给外国人看的学習型字典(ESL字典)开始,下面主要有6个领导品牌,而它们都有做所谓的单字频率 (字频)来提醒读者这个单字的使用頻率高不高? 常用不常用? 以下分别解说之:
❶ Oxford Advanced Learner's Dictionary 9th(OALD9)
牛津有自己的Oxford3000单词表,OALD9在字典中把这3000基本单词加上「钥匙符号」,表示这是整本词典里面最常用、最简单基础的3000单词。基本上我个人觉得牛津词典只整理出常用单词3000个单字是真的太少,像朗文整理出9000个常用单词、柯林斯整理出14700个,而剑桥词典也整理出16000个基本常用单词。例如下面OALD9字典的heaven旁边就有一个「钥匙符号」表示这单词是属于Oxford常用3000单词范围里面。
到了牛津高阶10版 (Oxford Advanced Learner's Dictionary 10th(OALD10)),牛津10的标注又有一些改变。就是推出Oxford 3000和Oxford 5000的词表,在这两个词表的范围的单词旁边会有标注。根据牛津官方网站的定义,介绍如下:What is the Oxford 3000?The Oxford 3000 is a list of the 3,000 core words that every learner of English needs to know. The words have been chosen based on their frequency in the Oxford English Corpus and relevance to learners of English. Every word is aligned to the CEFR, guiding learners on the words they should know at A1-B2 level. What is the Oxford 5000?The Oxford 5000 is an expanded core word list for advanced learners of English. As well as the Oxford 3000 core word list, it includes an additional 2,000 words that are aligned to the CEFR, guiding advanced learners at B2-C1 level on the most useful high-level words to learn to expand their vocabulary. 也就是牛津10采用了CEFR standard (Common European Framework of Reference for Languages).这个标准,共有A1到C2。不过牛津10本身因为只到Oxford 5000词表,所以只列出到C1的等级,没有C2。也就是说,牛津10和剑桥词典一样,改采用了「CEFR standard」这标准来划分词频。上图中,account旁边有标注B1,表示它是属于Oxford3000词表的单词。 English Basic User (A1, A2) A1 (Beginner) A2 (Elementary English) English Independent User (B1, B2) B1 (Intermediate English) B2 (Upper-Intermediate English) Proficient English User (C1, C2) C1 (Advanced English) →牛津10只列出到C1单词。
C2 (Proficiency English)
❷ Longman Dictionary of Contemporary English(LDOCE6)
✔朗文字典五版将口语单词和书写单词各分成最基本的3000单词,在字典接口上会标示 S与W。S代表Spoken Englsih 而W 代表Written Englsih。朗文将常用3000单词共分成S1 S2 S3以及W1 W2 W3。意思是说,S1表示属于『口语』最常用一千单词,而W1表示「书写」最常用的1千单词。而S3就表示这是「口语」最常用的3000单词,依此类推。口语与书写单词的常用频率分开标示是朗文的『独创』。朗文整理出来的这3000个单词叫作Longman Communication 3000,这是朗文字典LDOCE第5版开始,用它的语料库整理出 Longman Communication 3000,表示这三千个单词是日常生活沟通时最常用的英文单词。LDOCE6版从3000单字扩充到Longman Communication 9000,一下子变成9000常用字。因此,朗文第6版在标示上,除了原来的S1, S2, S3 与 W1, W2, W3之外,还以「红色圆点」来表示Longman Communication 9000。1000到3000单词有3个红点。3千字到6千字有2个红点,而6千字到9千单词有1个红点。也就是说,原来属于3000单词的词条,除了有 S 与 W 标示外,在朗文6版又多三个红点来辅助标示。如下面的love有标示S1 W1表示这是口语和书写常用单词的1千字,另外三颗红点●●●表示这是常用单字1-3000单词的范围。
✔Longman Communication 9000常用字整理如下:
①●:6000~9000
②●●:3000~6000
③●●●:1~3000
❸ Macmillan English Dictionary for Advanced Learners(MED2)
✔麦克米伦字典公司统计出日常生活的90%的用语都在基本单词7500单字里面,因此有整理出这7500个基本单词加上「星号★」表示这是属于7500个基本常用词的「星级单词」,共分成3级,我称作「三星单词」,每级单字各有2500个,三级加起来共有7500个。以3颗星单词最简单,范围是在最常用的单词的1到2500单词之间,而2星单词的范围是在2500到5000单字,最后的1星单词则是5000到7500。基本上和上面的字典标示的道理相同,就是星星越少,表示这个单词越难;星星越多,表示这单词越常用、越简单。
✔Macmillan三星单词整理如下:
①三星单词★★★:1~2500
②二星单词★★:2500~5000
③一星单词★:5000~7500
❹ Collins Cobuild 12th:Collins Cobuild Advanced Learner's English Dictionary
✔柯林斯词典则是用红色的圆点来表示单词的常用度和使用的频率。比起朗文的9千字或是麦克米伦的7500单词,柯林斯则认为英文的基本常用单词至少有14700个单词左右,并且分成5级。柯林斯词典的官网写说:「Collins Cobuild Dictionary groups items into five frequency bands. Items in the five bands make up 95% of all spoken and written English.」也就是说,大约1万5千的单词是柯林斯用语料库整理出最基本的单词,占了口语和书写的英文95%,也就是你只要背了柯林斯的1万5千基本单词后,大约95%的英文书籍或杂志都能看得懂。这14700单字又分成5级。有5颗红点的是最常用的700单词。而四颗红点的单词共有1200个。3颗红点的单词则有1500个。2颗红点的则有3200个。1颗红点的单词则有8100个,这5级单字总共有14700个。
Collins 14700常用单字整理如下:
①5级单词●●●●●:1~700 (共700个)
②4级单词●●●●:700~1900 (共1200个)
③3级单词●●●:1900~3400 (共1500个)
④2级单词●●:3400~6600 (共3200个)
⑤1级单词●:6600~14700 (共8100个)
★1~5级单词总共有14700单词,而非网上有人声称的14600个。
另根据lgmcw大的文章,也有下面的分法,补充如下:
https://www.pdawiki.com/forum/thread-36345-1-1.html?x=48936
★★★★★ 5星词汇,有很多动词短语。源列表5星词汇共有1352个,词频是最常用的0001~1353。
★★★★☆ 4星词汇。源列表4星词汇共有1388个,词频是最常用的1354~2741。
★★★☆☆ 3星词汇。源列表3星词汇共有1831个,词频是2742~4572。
★★☆☆☆ 2星词汇。源列表2星词汇共有3407个,词频是4573~7979。
★☆☆☆☆ 1星词汇。源列表1星词汇共有8228个,词频是7980~16207。
☆☆☆☆☆ 0星词汇。柯林斯源列表0星词汇共有17122个,词频是16208~33328。
个人认为,如果能把这柯林斯5级单词14700全部背完,基本上不论是考研或是读英語原文书都不是问题!因为柯林斯是用语料库的大数据整理出来的约1万5千个常用单词,因此一定是美国或英国人常用的。版上有人已整理这个柯林斯用语料库整理出来的14700常用词的PDF了,见:
https://www.pdawiki.com/forum/fo ... 6791&fromuid=183319
❺ Cambridge Advanced Learner's Dictionary(CALD4)
✔根据George Chen的说法,『剑桥高级词典4版与3版最大差别在常用词标示系统的变更,3版时,以 E (Essential), I (Improver), A (Advanced) 三个等级表示语料库出现的频率,分别是每1千万单词出现的次数为 400、200 到 400,以及 100 到 200 次。而且常用度标示的基础是收录词条底下的定义,不是粗糙地标注在收录词条上。某个字是否常用,通常不是该字的所有定义整体一致的表现,尤其一字多义的字,可能仅只少数几个定义常用,其他就很普通。CALD3 深入定义标示,做法精确,提供另一种不同角度的观察方向。到了 CALD4,常用度标示看不到 E, I, A 的方式,取而代之的是 A1, A2, B1, B2, C1, C2。原来整套系统改采 Common European Framework of Reference 的定义模式』,总共把最常用的基本单字分成6级,如下:
一、A Basic User
❶A1 beginner
❷A2 elementary
二、B Independent User
❸B1 intermediate
❹B2 upper intermediate
三、C Proficient User
❺C1 advanced
❻C2 Mastery or proficiency
不过George Chen没有提到剑桥整理的常用单词到底有多少字?是只有3000字還是有7000字?。经过我上网查询之后,我发现Cambridge词典挑出1万6千个英文单词作为英文的基本常用单词,再把它分成6级。A1单词有500个,而A2单词就变成2倍,有1000个,到了下一级B1又变成2000个。可以看出来上一级的单字是下一级单词的2倍,最后一级C2的单词有16000个。例如heaven这个单词有标示是B2就表示这是属于2000到4000单词里面的范围。这边整理如下:
❶A1:1~500
❷A2:500~1000
❸B1:1000~2000
❹B2:2000~4000
❺C1:4000~8000
❻C2:8000~16000
❻ Merriam-Webster's Advanced Learner's English Dictionary
《韦氏高阶英文词典》是属于美国人编写的词典,它的例句号称是英語學習型字典中收录例句最多的。有没有发现到,只要有advanced或learner等字的都是给英文非母语的学生用的。Merriam-Webster另外有出几本给美国人自己看的,例如著名的韦氏大字典就是。它也有整理出基本常用单字3000,和牛津出版社一样,但标示的方式却不同,如果是在常用3000单词里面的话,这个单词底下会划线来表示这是常用3000字。
以上是我最近整理出的心得,供各位对英英词典有兴趣的人参考,相信看懂这些英英单字的词频标示,对大家多多少少会有帮助。
因为你会发现各大词典对于他们整理出来的常用单词,不论是朗文的communication 9000或是柯林斯的14700常用单词,在词条的搭配用语或是例句、补充说明都会特别地加强。但如果超出了各词典的常用词,例如你在朗文词典或OALD9查Sodomite,不但释义一句话简单带过,而且没有**补充甚至连例句都没有。因此各学**型词典其实也只是针对那些所谓的常用单词有特别加强,例如列很多搭配用法、加写很多例句,超出了常用字范围,其实去查AHD或ODE、SOED、Webster等大型词典书比较能得到详解。当然各词典的常用单词标示都不一样,各搞各的,没有统一的作法,因此看完这篇我的研究心得之后,相信大家都有种豁然开朗的感觉。我为了写这篇上网和去图书馆找了不少资料,希望对大家在查英英词典时有帮助,如果觉得看完对你有帮助,请不要忘记帮我评分,你的评分就是我发帖的最大动力!。
|