查看: 1739|回复: 15
打印 上一主题 下一主题

[英汉] [20160525修订]GRE 单词按 Roget's Thesaurus 归类整理

[复制链接]

该用户从未签到

19

主题

363

回帖

2553

积分

解元

Rank: 5Rank: 5

积分
2553

灌水大神章小蜜蜂章笑傲江湖章

跳转到指定楼层
1
发表于 2016-5-22 20:16:33 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 fnaviwwo1 于 2016-7-6 19:19 编辑

为纯文本文件。 gre_6000_tree.rar (164.58 KB, 下载次数: 123) https://raw.githubusercontent.co ... utput_6000_tree.txt http://paste.ubuntu.net/16628498/
新东方论坛上找了一个GRE单词表,按照1911版的 Roget's Thesaurus,把所有单词重新分类整理为树状结构。
效果见下(仅列出前面几行)
红宝书单词 Rogot's 排序

[TOC]

# Class I. Words Expressing Abstract Relations

## Section I. Existence

### 1. Being, in The Abstract

#### existence 1

absolute    a.绝对的,完全的; 无(条件)限制的    [ab-so-lute]
authentic    a.真正的;法律证实的    [au-then-tic]
essential    a.本质的;n.要素,实质    [es-sen-tial]
extant    a.现存的,传世的    [ex-tant]
substantial    a.坚固的,结实的;实质的    [sub-stan-tial]
substantive    a.根本的;独立存在的    [sub-stan-tive]
entity    n.实体,统一体    [en-ti-ty]
subsistence    n.生存,生计;存在    [sub-sist-ence]
abide    v.容忍,忍受    [a-bide]
endure    v.忍受,忍耐    [en-dure]
prevail    v.战胜;盛行    [pre-vail]

#### inexistence 2

extinct    a.绝种的,不存在的    [ex-tinct]
insubstantial    a.非实体的;薄弱的    [in-sub-stan-tial]
potential    a.潜在的,有可能性的    [po-ten-tial]
spectral    a.幽灵的    [spec-tral]
vain    a.自负的;徒劳的    [vain]
virtual    a.实质上的,实际上的    [vir-tu-al]
visionary    a.有远见的;幻想的;n.空想家    [vi-sion-ar-y]
abeyance    n.中止,搁置    [a-bey-ance]
die    n.金属模子,印模    [die]
extinction    n.熄灭;消灭    [ex-tinc-tion]
extirpation    n.根除,铲除    [ex-tir-pa-tion]
nil    n.无,零    [nil]
nonentity    n.不重要之人或事    [non-en-ti-ty]
abrogate    v.废止,废除    [ab-ro-gate]
annihilate    v.消灭    [an-ni-hi-late]
dissolve    v.使固体溶解    [dis-solve]
nullify    v.使无效,取消    [nul-li-fy]
obliterate    v.涂掉,擦掉    [o-blit-e-rate]
perish    v.死,暴卒    [per-ish]
remove    v.移走;脱掉;迁移    [re-move]

### 2. Being, In The Concrete

#### substantiality 3

corporeal    a.肉体的,身体的;物质的    [cor-po-re-al]
substantial    a.坚固的,结实的;实质的    [sub-stan-tial]
substantive    a.根本的;独立存在的    [sub-stan-tive]
tangible    a.可触摸的    [tan-gi-ble]
substance    n.大意,根据,实质;物质    [sub-stance]

#### unsubstantiality 4

ethereal    a.太空;轻巧的    [e-the-re-al]
illusory    a.虚幻的    [il-lu-so-ry]
inane    a.无意义的;空洞的    [in-ane]
insubstantial    a.非实体的;薄弱的    [in-sub-stan-tial]
nominal    a.名义上的,有名无实的    [nom-i-nal]
spectral    a.幽灵的    [spec-tral]
vacuous    a.发呆的,愚笨的    [vac-u-ous]
visionary    a.有远见的;幻想的;n.空想家    [vi-sion-ar-y]
void    a.空的,缺乏的;n.空隙,空处;空虚感    [void]
cipher    n.零;无影响力的人;密码    [ci-pher]
nil    n.无,零    [nil]
nonentity    n.不重要之人或事    [non-en-ti-ty]
phantom    n.鬼怪,幽灵;幻像    [phan-tom]
dissolve    v.使固体溶解    [dis-solve]
evaporate    v.(使某物)蒸发掉    [e-vap-o-rate]
fade    v.褪色,消失,凋谢    [fade]

### 3. Formal Existence

#### intrinsicality 5

characteristic    a.有特色的;典型性的;n.与众不同的特征    [char-ac-ter-is-tic]
essential    a.本质的;n.要素,实质    [es-sen-tial]
fundamental    a.最根本的,基本的;十分重要的    [fun-da-men-tal]
hereditary    a.祖传的,世袭的    [he-red-i-tar-y]
immanent    a.内在的;普遍存在的    [im-ma-nent]
inborn    a.天生的,天赋的    [in-born]
incarnate    a.具有肉体的;化身的    [in-car-nate]
incorrigible    a.积习难改的,不可救药的    [in-cor-ri-gi-ble]
indigenous    a.土产的,本地的    [in-dig-e-nous]
ingrained    a.根深蒂固的    [in-grained]
innate    a.生来的,天赋的    [in-nate]
instinctive    a.本能的    [in-stinc-tive]
subjective    a.主观的,想象的    [sub-jec-tive]
virtual    a.实质上的,实际上的    [vir-tu-al]
constitution    n.宪法;体质    [con-sti-tu-tion]
core    n.果心;核心);v.去掉某物的中心部分    [core]
disposition    n.处理;天性,气质    [dis-po-si-tion]
gist    n.要点,要旨    [gist]
grain    n.谷物;小的硬粒    [grain]
pith    n.精髓,要点    [pith]
principle    n.原则,原理;道德准则    [prin-ci-ple]
sap    n.树液;活力;v.消弱,耗尽    [sap]
humor    v.纵容,迁就    [hu-mor]
temper    v.锤炼;缓和;n.脾气    [tem-per]

#### extrinsicality 6

adventitious    a.偶然的    [ad-ven-ti-tious]
contingent    a.意外的;视情况或条件而定的    [con-tin-gent]
extraneous    a.外来的;无关的    [ex-tra-ne-ous]
fortuitous    a.偶然的,意外的;幸运的    [for-tu-i-tous]
objective    a.客观的;n.目标    [ob-jec-tive]

### 4. Modal Existence

#### state 7

aspect    n.(问题等的)方面;面貌,外表    [as-pect]
category    n.类别,范畴    [cat-e-go-ry]
constitution    n.宪法;体质    [con-sti-tu-tion]
dilemma    n.困境,左右为难    [di-lem-ma]
fabric    n.纺织品;结构    [fab-ric]
guise    n.外观,装束    [guise]
lot    n.签;命运;v.抽签,划分    [lot]
mode    n.样式,时尚;模式    [mode]
mold    n.模子;(美)霉;v.塑造    [mold]
plight    n.困境,苦境    [plight]
predicament    n.困境,窘境    [pre-dic-a-ment]
tenor    n.男高音;要点,要旨    [ten-or]
stamp    v./n.跺脚;在…上盖印    [stamp]
temper    v.锤炼;缓和;n.脾气    [tem-per]
trim    v.修剪;a.井井有条的    [trim]

#### circumstance 8

adventitious    a.偶然的    [ad-ven-ti-tious]
circumstantial    a.不重要的,偶然的;描述详细的    [cir-cum-stan-tial]
contingent    a.意外的;视情况或条件而定的    [con-tin-gent]
critical    a.挑毛病的;关键的,危急的    [crit-i-cal]
provisional    a.暂时的,临时的    [pro-vi-sion-al]
context    n.(语句等的)上下文    [con-text]
emergency    n.紧急事件    [e-mer-gen-cy]
occurrence    n.事件;发生    [oc-cur-rence]
posture    n.姿势,体态;态度;v.故作姿态    [pos-ture]
predicament    n.困境,窘境    [pre-dic-a-ment]
regime    n.政权,政治制度    [re-gime]
status    n.身分,地位    [sta-tus]
pinch    v.捏,掐;n.一撮,一点    [pinch]


Roget's Thesaurus 是按照什么哲学方法排序的,我觉得有点头晕,不过把所有单词这样排列一下我觉得会比纯字母顺序很好记。
况且Roget也是著名的权威书籍了,它的分类方法很有代表意义,很适合作为背单词的参照吧。
自己对效果还不怎么满意,各位有什么关于整理单词表的想法,请多多赐教。

Roget's Thesaurus 的排序方法可以看维基百科:
https://en.wikipedia.org/wiki/Wi ... Roget%27s_Thesaurus

简单来说就是这本词典把所有单词分成了 6 大类,若干小类,总计1000个意向。
意向排列成树状结构,每个意向内的单词词义相关,相邻的意向词义相反。

本帖被以下淘专辑推荐:

  • · GRE|主题: 2, 订阅: 1

该用户从未签到

19

主题

363

回帖

2553

积分

解元

Rank: 5Rank: 5

积分
2553

灌水大神章小蜜蜂章笑傲江湖章

推荐
 楼主| 发表于 2016-5-22 22:13:53 | 只看该作者
本帖最后由 fnaviwwo1 于 2016-5-23 13:16 编辑

补上处理用的脚本,用来处理SAT词汇,托福词汇都是可以的。
Roget’s Thesaurus用的Project Gutenberg的数据。
  1. #coding: utf-8
  2. module Enumerable
  3.   def stable_sort
  4.     sort_by.with_index { |x, idx| [x, idx] }
  5.   end

  6.   def stable_sort_by
  7.     sort_by.with_index { |x, idx| [yield(x), idx] }
  8.   end
  9. end

  10. $ab = open('GRE红宝书.txt','r:gbk:utf-8').each_line.map{|line|line.tap(&:chomp!).split("\t")}.inject({}){|h,(k,v)|h[k]=v;h};

  11. $k = open('10681-index.txt','r:MacRoman').read.scan(/((.+)\n(        .+ \d.*\n)+)/).map{|w,_|
  12.   w.split("\n").map(&:strip)
  13. }
  14. p $k.assoc("abide")

  15. $k.select!{|w|$ab[w.first]}
  16. $my_keys = $k.map(&:first)

  17. $dict = {}
  18. $group = Hash.new{|h,k|h[k]=[]}
  19. $k.each{|line|
  20.   word = line.shift
  21.   line.each{|x|
  22.     $group[x] << word
  23.   }
  24.   $dict[word] = line
  25. }

  26. def gg(w)
  27.   "#{w}    #{$ab[w]}    [#{$mhyph[w]||w}]"
  28. end
  29. h = 165.chr.force_encoding('MacRoman').encode('utf-8')
  30. $mhyph = {}&&open('mhyph.txt','r:MacRoman:utf-8').each_line.inject({}){|a,b|b.chomp!;a[b.gsub(h,'')]=b.gsub(h,'-');a}


  31. $text = $group.keys.inject({}){|a,key|
  32.   a[key[/\d+.*$/]] = "**** #{key}\n\n"<<($group[key].map{|w| gg(w)<<""}.stable_sort_by{|x|x[/ (.\.)/]||''}*"\n")
  33.   a
  34. }


  35. open("output_6000_tree.txt","w:utf-8"){|out|

  36.    out.puts(open('outline.txt','r:utf-8').read.gsub("\n","\n\n").gsub(/^\*\*\*\* (.+)\. .*$/){|x|
  37.      "#{$text[$~[1]]}"
  38.    })
  39.   out.puts "\n* \n"
  40.   out.puts ($ab.keys-$my_keys).map{|w| gg(w)}
  41. }

  42. p :ok
复制代码

该用户从未签到

24

主题

701

回帖

4442

积分

翰林院修撰

不傲嬌的傲嬌

Rank: 12Rank: 12Rank: 12

积分
4442

灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

2
发表于 2016-5-22 21:16:45 | 只看该作者
Roget's 是所謂的「分類詞典」,放棄傳統的字母表排序,而從概念入手,十分創新,但是也造成了一定的麻煩。
記得 O 大有介紹過 Roget's,可以找帖子看看,我就不繼續班門弄斧了。
  • TA的每日心情
    开心
    2021-9-10 00:49
  • 签到天数: 1103 天

    [LV.10]以坛为家III

    0

    主题

    1826

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    16147

    笑傲江湖章灌水大神章

    4
    发表于 2016-5-23 12:42:19 | 只看该作者
    谢谢楼主分享

    该用户从未签到

    19

    主题

    363

    回帖

    2553

    积分

    解元

    Rank: 5Rank: 5

    积分
    2553

    灌水大神章小蜜蜂章笑傲江湖章

    5
     楼主| 发表于 2016-5-23 13:21:40 | 只看该作者
    本帖最后由 fnaviwwo1 于 2016-5-23 13:25 编辑


    修改了一下,一共6000个单词,现在所有单词都是树状排列的啦!
    自己觉得把单词弄成一颗树的样子,意思相近的单词相互靠近,是很利于记忆单词的呢。
    不过1911版的Rogot's有不少词没收,只好列在最后了...

    该用户从未签到

    0

    主题

    510

    回帖

    1317

    积分

    解元

    Rank: 5Rank: 5

    积分
    1317

    灌水大神章

    7
    发表于 2016-5-26 13:15:22 | 只看该作者
    谢谢楼主分享

    该用户从未签到

    19

    主题

    363

    回帖

    2553

    积分

    解元

    Rank: 5Rank: 5

    积分
    2553

    灌水大神章小蜜蜂章笑傲江湖章

    8
     楼主| 发表于 2016-5-31 01:12:53 | 只看该作者
    又有一些改动。
    把《再要你命三千》按照 Roget's Thesaurus 归类了一下,一共3000个单词,比上面的6000的版本单词量少一些,不过这次没标中文释义。
    http://paste.ubuntu.net/16841635/
    此外。排序算法做了一些修改:
    1.对于Roget's 1911版没有收录的单词,现在根据 Moby Thesaurus 中的近义词进行归类。
    2.一个单词在Roget's中作为动词短语出现,也会排列为一个条目。
    3.每个单词第一次出现时标“+”,之后出现时标“-”,这样可以突出重点。

    该用户从未签到

    0

    主题

    2

    回帖

    53

    积分

    童生

    Rank: 2

    积分
    53
    9
    发表于 2017-2-13 15:02:36 | 只看该作者
    fnaviwwo1 发表于 2016-5-31 01:12
    又有一些改动。
    把《再要你命三千》按照 Roget's Thesaurus 归类了一下,一共3000个单词,比上面的6000的 ...

    lz,http://paste.ubuntu.net/16841635//没有东西,三千的能重发出来吗,谢谢

    该用户从未签到

    5

    主题

    98

    回帖

    1232

    积分

    解元

    Rank: 5Rank: 5

    积分
    1232
    10
    发表于 2018-6-9 22:47:43 | 只看该作者
    fnaviwwo1 发表于 2016-5-31 01:12
    又有一些改动。
    把《再要你命三千》按照 Roget's Thesaurus 归类了一下,一共3000个单词,比上面的6000的版 ...

    网址变了,ubuntu 也不做个跳转 ...

    https://paste.ubuntu.com/16841635/
  • TA的每日心情
    奋斗
    2020-2-27 18:40
  • 签到天数: 151 天

    [LV.7]常住居民III

    0

    主题

    197

    回帖

    3384

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3384

    QQ 章笑傲江湖章灌水大神章

    11
    发表于 2018-9-14 15:18:04 | 只看该作者
    请问一下楼主,你用的是shell脚本语言吗?
  • TA的每日心情
    奋斗
    2020-11-15 11:37
  • 签到天数: 249 天

    [LV.8]以坛为家I

    20

    主题

    1368

    回帖

    4万

    积分

    状元

    牛津爱好者

    Rank: 9Rank: 9Rank: 9

    积分
    41348

    灌水大神章小蜜蜂章笑傲江湖章QQ 章推广专家

    12
    发表于 2018-10-2 20:26:14 | 只看该作者
    这个好棒,感觉Roget的分类还挺科学的。不知道能不能分享一下用Moby Thesaurus补漏的代码?
  • TA的每日心情
    奋斗
    2020-11-15 11:37
  • 签到天数: 249 天

    [LV.8]以坛为家I

    20

    主题

    1368

    回帖

    4万

    积分

    状元

    牛津爱好者

    Rank: 9Rank: 9Rank: 9

    积分
    41348

    灌水大神章小蜜蜂章笑傲江湖章QQ 章推广专家

    13
    发表于 2018-10-2 20:36:54 | 只看该作者
    CHKan2 发表于 2018-9-14 15:18
    请问一下楼主,你用的是shell脚本语言吗?

    LZ用的是Ruby
  • TA的每日心情
    奋斗
    2020-2-27 18:40
  • 签到天数: 151 天

    [LV.7]常住居民III

    0

    主题

    197

    回帖

    3384

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3384

    QQ 章笑傲江湖章灌水大神章

    14
    发表于 2018-10-2 22:41:15 | 只看该作者
    lgmcw 发表于 2018-10-2 20:26
    这个好棒,感觉Roget的分类还挺科学的。不知道能不能分享一下用Moby Thesaurus补漏的代码? ...

    Moby Thesaurus补漏的代码?你说的是楼主使用的脚本吗
  • TA的每日心情
    奋斗
    2020-2-27 18:40
  • 签到天数: 151 天

    [LV.7]常住居民III

    0

    主题

    197

    回帖

    3384

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3384

    QQ 章笑傲江湖章灌水大神章

    15
    发表于 2018-10-2 22:50:23 | 只看该作者
    lgmcw 发表于 2018-10-2 20:26
    这个好棒,感觉Roget的分类还挺科学的。不知道能不能分享一下用Moby Thesaurus补漏的代码? ...

    你好,请问你知道楼主是怎样操作将这些单词分类的,“授人以鱼不如授人以渔“,好想掌握这种方法,谢谢您,希望可以一起学习交流
  • TA的每日心情

    2021-10-23 19:58
  • 签到天数: 212 天

    [LV.7]常住居民III

    3

    主题

    461

    回帖

    1952

    积分

    解元

    Rank: 5Rank: 5

    积分
    1952
    16
    发表于 2021-1-5 21:24:58 | 只看该作者
    fnaviwwo1 发表于 2016-5-22 22:13
    补上处理用的脚本,用来处理SAT词汇,托福词汇都是可以的。
    Roget’s Thesaurus用的Project Gutenberg的数 ...

    10681-index.txt 请问哪里有