[20160525修订]GRE 单词按 Roget's Thesaurus 归类整理

fnaviwwo1 · 发表于 2016-5-22 20:16:33

本帖最后由 fnaviwwo1 于 2016-7-6 19:19 编辑

为纯文本文件。

gre_6000_tree.rar (164.58 KB, 下载次数: 123) https://raw.githubusercontent.co ... utput_6000_tree.txt http://paste.ubuntu.net/16628498/
新东方论坛上找了一个GRE单词表，按照1911版的 Roget's Thesaurus，把所有单词重新分类整理为树状结构。
效果见下（仅列出前面几行）

红宝书单词 Rogot's 排序

[TOC]

# Class I. Words Expressing Abstract Relations

## Section I. Existence

### 1. Being, in The Abstract

#### existence 1

absolute a.绝对的，完全的; 无(条件)限制的 [ab-so-lute]
authentic a.真正的；法律证实的 [au-then-tic]
essential a.本质的；n.要素，实质 [es-sen-tial]
extant a.现存的，传世的 [ex-tant]
substantial a.坚固的，结实的；实质的 [sub-stan-tial]
substantive a.根本的；独立存在的 [sub-stan-tive]
entity n.实体，统一体 [en-ti-ty]
subsistence n.生存，生计；存在 [sub-sist-ence]
abide v.容忍，忍受 [a-bide]
endure v.忍受，忍耐 [en-dure]
prevail v.战胜；盛行 [pre-vail]

#### inexistence 2

extinct a.绝种的，不存在的 [ex-tinct]
insubstantial a.非实体的；薄弱的 [in-sub-stan-tial]
potential a.潜在的，有可能性的 [po-ten-tial]
spectral a.幽灵的 [spec-tral]
vain a.自负的；徒劳的 [vain]
virtual a.实质上的，实际上的 [vir-tu-al]
visionary a.有远见的；幻想的；n.空想家 [vi-sion-ar-y]
abeyance n.中止，搁置 [a-bey-ance]
die n.金属模子，印模 [die]
extinction n.熄灭；消灭 [ex-tinc-tion]
extirpation n.根除，铲除 [ex-tir-pa-tion]
nil n.无，零 [nil]
nonentity n.不重要之人或事 [non-en-ti-ty]
abrogate v.废止，废除 [ab-ro-gate]
annihilate v.消灭 [an-ni-hi-late]
dissolve v.使固体溶解 [dis-solve]
nullify v.使无效，取消 [nul-li-fy]
obliterate v.涂掉，擦掉 [o-blit-e-rate]
perish v.死，暴卒 [per-ish]
remove v.移走；脱掉；迁移 [re-move]

### 2. Being, In The Concrete

#### substantiality 3

corporeal a.肉体的，身体的；物质的 [cor-po-re-al]
substantial a.坚固的，结实的；实质的 [sub-stan-tial]
substantive a.根本的；独立存在的 [sub-stan-tive]
tangible a.可触摸的 [tan-gi-ble]
substance n.大意，根据，实质；物质 [sub-stance]

#### unsubstantiality 4

ethereal a.太空；轻巧的 [e-the-re-al]
illusory a.虚幻的 [il-lu-so-ry]
inane a.无意义的；空洞的 [in-ane]
insubstantial a.非实体的；薄弱的 [in-sub-stan-tial]
nominal a.名义上的，有名无实的 [nom-i-nal]
spectral a.幽灵的 [spec-tral]
vacuous a.发呆的，愚笨的 [vac-u-ous]
visionary a.有远见的；幻想的；n.空想家 [vi-sion-ar-y]
void a.空的，缺乏的；n.空隙，空处；空虚感 [void]
cipher n.零；无影响力的人；密码 [ci-pher]
nil n.无，零 [nil]
nonentity n.不重要之人或事 [non-en-ti-ty]
phantom n.鬼怪，幽灵；幻像 [phan-tom]
dissolve v.使固体溶解 [dis-solve]
evaporate v.(使某物)蒸发掉 [e-vap-o-rate]
fade v.褪色，消失，凋谢 [fade]

### 3. Formal Existence

#### intrinsicality 5

characteristic a.有特色的；典型性的；n.与众不同的特征 [char-ac-ter-is-tic]
essential a.本质的；n.要素，实质 [es-sen-tial]
fundamental a.最根本的，基本的；十分重要的 [fun-da-men-tal]
hereditary a.祖传的，世袭的 [he-red-i-tar-y]
immanent a.内在的；普遍存在的 [im-ma-nent]
inborn a.天生的，天赋的 [in-born]
incarnate a.具有肉体的；化身的 [in-car-nate]
incorrigible a.积习难改的，不可救药的 [in-cor-ri-gi-ble]
indigenous a.土产的，本地的 [in-dig-e-nous]
ingrained a.根深蒂固的 [in-grained]
innate a.生来的，天赋的 [in-nate]
instinctive a.本能的 [in-stinc-tive]
subjective a.主观的，想象的 [sub-jec-tive]
virtual a.实质上的，实际上的 [vir-tu-al]
constitution n.宪法；体质 [con-sti-tu-tion]
core n.果心；核心)；v.去掉某物的中心部分 [core]
disposition n.处理；天性，气质 [dis-po-si-tion]
gist n.要点，要旨 [gist]
grain n.谷物；小的硬粒 [grain]
pith n.精髓，要点 [pith]
principle n.原则，原理；道德准则 [prin-ci-ple]
sap n.树液；活力；v.消弱，耗尽 [sap]
humor v.纵容，迁就 [hu-mor]
temper v.锤炼；缓和；n.脾气 [tem-per]

#### extrinsicality 6

adventitious a.偶然的 [ad-ven-ti-tious]
contingent a.意外的；视情况或条件而定的 [con-tin-gent]
extraneous a.外来的；无关的 [ex-tra-ne-ous]
fortuitous a.偶然的，意外的；幸运的 [for-tu-i-tous]
objective a.客观的；n.目标 [ob-jec-tive]

### 4. Modal Existence

#### state 7

aspect n.(问题等的)方面；面貌，外表 [as-pect]
category n.类别，范畴 [cat-e-go-ry]
constitution n.宪法；体质 [con-sti-tu-tion]
dilemma n.困境，左右为难 [di-lem-ma]
fabric n.纺织品；结构 [fab-ric]
guise n.外观，装束 [guise]
lot n.签；命运；v.抽签，划分 [lot]
mode n.样式，时尚；模式 [mode]
mold n.模子；(美)霉；v.塑造 [mold]
plight n.困境，苦境 [plight]
predicament n.困境，窘境 [pre-dic-a-ment]
tenor n.男高音；要点，要旨 [ten-or]
stamp v./n.跺脚；在…上盖印 [stamp]
temper v.锤炼；缓和；n.脾气 [tem-per]
trim v.修剪；a.井井有条的 [trim]

#### circumstance 8

adventitious a.偶然的 [ad-ven-ti-tious]
circumstantial a.不重要的，偶然的；描述详细的 [cir-cum-stan-tial]
contingent a.意外的；视情况或条件而定的 [con-tin-gent]
critical a.挑毛病的；关键的，危急的 [crit-i-cal]
provisional a.暂时的，临时的 [pro-vi-sion-al]
context n.(语句等的)上下文 [con-text]
emergency n.紧急事件 [e-mer-gen-cy]
occurrence n.事件；发生 [oc-cur-rence]
posture n.姿势，体态；态度；v.故作姿态 [pos-ture]
predicament n.困境，窘境 [pre-dic-a-ment]
regime n.政权，政治制度 [re-gime]
status n.身分，地位 [sta-tus]
pinch v.捏，掐；n.一撮，一点 [pinch]

Roget's Thesaurus 是按照什么哲学方法排序的，我觉得有点头晕，不过把所有单词这样排列一下我觉得会比纯字母顺序很好记。
况且Roget也是著名的权威书籍了，它的分类方法很有代表意义，很适合作为背单词的参照吧。
自己对效果还不怎么满意，各位有什么关于整理单词表的想法，请多多赐教。

Roget's Thesaurus 的排序方法可以看维基百科：
https://en.wikipedia.org/wiki/Wi ... Roget%27s_Thesaurus

简单来说就是这本词典把所有单词分成了 6 大类，若干小类，总计1000个意向。
意向排列成树状结构，每个意向内的单词词义相关，相邻的意向词义相反。

fnaviwwo1 · 发表于 2016-5-22 22:13:53

本帖最后由 fnaviwwo1 于 2016-5-23 13:16 编辑

补上处理用的脚本，用来处理SAT词汇，托福词汇都是可以的。
Roget’s Thesaurus用的Project Gutenberg的数据。

#coding: utf-8
module Enumerable
def stable_sort
sort_by.with_index { |x, idx| [x, idx] }
end
def stable_sort_by
sort_by.with_index { |x, idx| [yield(x), idx] }
end
end
$ab = open('GRE红宝书.txt','r:gbk:utf-8').each_line.map{|line|line.tap(&:chomp!).split("\t")}.inject({}){|h,(k,v)|h[k]=v;h};
$k = open('10681-index.txt','r:MacRoman').read.scan(/((.+)\n( .+ \d.*\n)+)/).map{|w,_|
w.split("\n").map(&:strip)
}
p $k.assoc("abide")
$k.select!{|w|$ab[w.first]}
$my_keys = $k.map(&:first)
$dict = {}
$group = Hash.new{|h,k|h[k]=[]}
$k.each{|line|
word = line.shift
line.each{|x|
$group[x] << word
}
$dict[word] = line
}
def gg(w)
"#{w} #{$ab[w]} [#{$mhyph[w]||w}]"
end
h = 165.chr.force_encoding('MacRoman').encode('utf-8')
$mhyph = {}&&open('mhyph.txt','r:MacRoman:utf-8').each_line.inject({}){|a,b|b.chomp!;a[b.gsub(h,'')]=b.gsub(h,'-');a}
$text = $group.keys.inject({}){|a,key|
a[key[/\d+.*$/]] = "**** #{key}\n\n"<<($group[key].map{|w| gg(w)<<""}.stable_sort_by{|x|x[/ (.\.)/]||''}*"\n")
a
}
open("output_6000_tree.txt","w:utf-8"){|out|
out.puts(open('outline.txt','r:utf-8').read.gsub("\n","\n\n").gsub(/^\*\*\*\* (.+)\. .*$/){|x|
"#{$text[$~[1]]}"
})
out.puts "\n* \n"
out.puts ($ab.keys-$my_keys).map{|w| gg(w)}
}
p :ok

复制代码

PurlingNayuki · 发表于 2016-5-22 21:16:45

Roget's 是所謂的「分類詞典」，放棄傳統的字母表排序，而從概念入手，十分創新，但是也造成了一定的麻煩。
記得 O 大有介紹過 Roget's，可以找帖子看看，我就不繼續班門弄斧了。

necuser98 · 发表于 2016-5-23 12:42:19

谢谢楼主分享

fnaviwwo1 · 发表于 2016-5-23 13:21:40

本帖最后由 fnaviwwo1 于 2016-5-23 13:25 编辑

necuser98 发表于 2016-5-23 12:42
谢谢楼主分享

修改了一下，一共6000个单词，现在所有单词都是树状排列的啦！
自己觉得把单词弄成一颗树的样子，意思相近的单词相互靠近，是很利于记忆单词的呢。
不过1911版的Rogot's有不少词没收，只好列在最后了...

mdictmania · 发表于 2016-5-26 13:15:22

谢谢楼主分享

fnaviwwo1 · 发表于 2016-5-31 01:12:53

又有一些改动。
把《再要你命三千》按照 Roget's Thesaurus 归类了一下，一共3000个单词，比上面的6000的版本单词量少一些，不过这次没标中文释义。
http://paste.ubuntu.net/16841635/
此外。排序算法做了一些修改：
1.对于Roget's 1911版没有收录的单词，现在根据 Moby Thesaurus 中的近义词进行归类。
2.一个单词在Roget's中作为动词短语出现，也会排列为一个条目。
3.每个单词第一次出现时标“+”，之后出现时标“-”，这样可以突出重点。

Abigaleliber · 发表于 2017-2-13 15:02:36

fnaviwwo1 发表于 2016-5-31 01:12
又有一些改动。
把《再要你命三千》按照 Roget's Thesaurus 归类了一下，一共3000个单词，比上面的6000的 ...

lz，http://paste.ubuntu.net/16841635//没有东西，三千的能重发出来吗，谢谢

tea · 发表于 2018-6-9 22:47:43

fnaviwwo1 发表于 2016-5-31 01:12
又有一些改动。
把《再要你命三千》按照 Roget's Thesaurus 归类了一下，一共3000个单词，比上面的6000的版 ...

网址变了，ubuntu 也不做个跳转 ...

https://paste.ubuntu.com/16841635/

CHKan2 · 发表于 2018-9-14 15:18:04

请问一下楼主，你用的是shell脚本语言吗？

lgmcw · 发表于 2018-10-2 20:26:14

这个好棒，感觉Roget的分类还挺科学的。不知道能不能分享一下用Moby Thesaurus补漏的代码？

lgmcw · 发表于 2018-10-2 20:36:54

CHKan2 发表于 2018-9-14 15:18
请问一下楼主，你用的是shell脚本语言吗？

LZ用的是Ruby

CHKan2 · 发表于 2018-10-2 22:41:15

lgmcw 发表于 2018-10-2 20:26
这个好棒，感觉Roget的分类还挺科学的。不知道能不能分享一下用Moby Thesaurus补漏的代码？ ...

Moby Thesaurus补漏的代码？你说的是楼主使用的脚本吗

CHKan2 · 发表于 2018-10-2 22:50:23

lgmcw 发表于 2018-10-2 20:26
这个好棒，感觉Roget的分类还挺科学的。不知道能不能分享一下用Moby Thesaurus补漏的代码？ ...

你好，请问你知道楼主是怎样操作将这些单词分类的，“授人以鱼不如授人以渔“，好想掌握这种方法，谢谢您，希望可以一起学习交流

lemonlab · 发表于 2021-1-5 21:24:58

fnaviwwo1 发表于 2016-5-22 22:13
补上处理用的脚本，用来处理SAT词汇，托福词汇都是可以的。
Roget’s Thesaurus用的Project Gutenberg的数 ...

10681-index.txt 请问哪里有

[英汉] [20160525修订]GRE 单词按 Roget's Thesaurus 归类整理

本帖被以下淘专辑推荐: