|
本帖最后由 fnaviwwo1 于 2016-7-10 14:54 编辑
COD&T
简明牛津词典及简明牛津同义词词典合并版
主要特性:
简明牛津衍生词是不单独列词条,目前论坛里的版本在衍生词跳转方面都不尽如人意,所以特别转换了这个版本来处理这个问题。
此外,个人觉得 thesaurus 是非常有用的资料,通过和简单词的类比,对写作很有好处,所以就把相应内容的词条也合并进去了。
关于简明牛津这本词典。
它很少标语法与读音信息,有一种说法是说母语使用者能够根据语感去领悟这些信息,用来配合学习型词典一起使用也很合适。
下载链接见底部更新地址
最后,处理文件时用的脚本作为隐藏福利
希望如下内容能够提供对以后mdx制作的帮助。
- #coding: utf-8
- $data = Hash.new{|h,k|h[k]=[]}
- def lload(file='b/Concise_Oxford_English_Diction.txt',style=1)
- open(file,'r:utf-8').each_line{|line|
- next if line.start_with?("#")
- line.chomp!
- line.gsub!("bword://","entry://")
- k,v = line.split("\t")
- v.gsub!(/^<font color="#007000">.+?<\/font> */,"")
- v.gsub!(/^(.*?) *(<br>|<BR>) *\\n/,"<h3><font size=5>\\1</font></h3>\\n")
- v.gsub!("\\n","\n")
- if style==2
- v.gsub!(/^(.*)$/m,'<span style="display:block;background-color:#FFC;">\1</span>')
- end
- ks = k.split("|")
- $data[word=ks.shift] << v
- ks.each{|x|
- $data[x]<<"@@@LINK=#{word}"
- }
- }
- end
- lload
- lload "b/Concise_Oxford_Thesaurus.mdx.txt",2
- $data.each_value{|v|
- v.uniq!
- a,b = v.partition{|x|!x.start_with?("@@@LINK=")}
- v.replace(b)
- v.unshift(a*"\n") if !a.empty?
- }
- open("output_coed_t_2.mdx.txt","w:utf-8"){|f|
- $data.each_pair{|k,v|
- v.each{|x|
- f.puts "#{k}\n#{x}\n</>"
- }
- }
- }
- p :ok
复制代码
简明牛津还有本美语版,不过两者制作思路不同,那本有标语法信息,解释更详细,有例句,没有词源,有同义词比较。
因为我是和论坛里的朗文当代5一起使用的,所以感觉这本国际版的牛津简明提供的信息更有互补性一些。
所以就先转换了这个版本,那本之后也会有机会的时候弄出来的,可以用来参考比较。
2016年6月30日更新版地址:https://www.pdawiki.com/forum/fo ... &fromuid=187860
|
|