|
推荐
楼主 |
发表于 2014-3-16 19:27:06
|
只看该作者
一直对朗文情有独钟!手头已经有了6本朗文词典:
朗文当代高阶英汉双解词典(第4版) (外研社2010, LDOCE4)
朗文当代高阶英汉双解词典(第5版) (台湾培生2013, LDOCE5)
朗文中阶英汉双解词典(第4版) (外研社2012, LDAE4)
朗文高阶英汉双解词典(新版) (外研社2013, LAAD3)
Longman Dictionary of Contemporary English, Fifth Edition (Pearson Longman 2009, LDOCE5)
Longman Dictionary of American English, 4th Edition (Pearson Longman 2008, LDAE4)
春节前花了大约两周的时间完成了朗文当代第五版的双解版的MDX/MDD。春节后又花了几个晚上的时间,制作完成Longman Advanced American Dictionary 最新第三版的MDX/MDD。我甚至觉得LAAD3不亚于朗文当代第五版,其最大的亮点是全真人发音的地道美式英语(单词4万余条,例句8万余条)。单词语音和LDOCE的美式录音是一样的,但例句却是全新的,而且也完全不同于LDAE 4的录音。
因为一个口音识别课题需要找语料样本,无意中发现了LDOCE网络版,此后才注意到MDict,由于本人是从事大型软件开发的,业余为了练手也做点小课题。说实话,目前朗文牛津自己开发的正版电子词典,水平做的并不高。朗文有这么好的词典,却做不出好的词典软件,真是隔行如隔山?而免费词典软件,虽然提供了大量通用格式词典文件,但离商业化的软件质量还是有很大差别,这可能和电子词典这类小型软件缺少商业资金而且可能出现大量的盗版有关。
原来的口音识别项目倒是没做了,但我却对语料库开始感兴趣。仅以朗文为基础,因为朗文的例句库是最丰富的,而且发音质量远胜于牛津(比较下LDOCE 5和OALD 8就知道)。就目前已有的朗文系列:LDOCE例句录音是87000+,LAAD是80000+,LDAE是35000+,这三个录音库虽然有些例句是相同的,但却是不同人朗读。有时比较同一个例句英美不同的读法,或者美语不同人的读法,特别让人印象深刻!
技术上,只是针对MDICT做一个双解版的LDOCE 5或LAAD 3都没有什么问题,目前已完成的LDOCE 5双解版已经可以达到95%以上的完整性,仅有数千条文本(释义和例句)没有翻译。而LDOCE 4双解版已经可以接近100%完整了。可是这些东西怎样拿出来分享却是个问题。想想现在LDOCE 5双解版大陆还未出版,LAAD第3版美国也才2013下半年才出版。如果这些词典的电子版提前流出,无疑是严重侵犯了出版商的利益。做软件这行的,尤其忌讳这个。
以前看到Oeasy发的一个交换计划的帖子,我觉得也许能成为一个小范围内“社区共享”的模式。首先共享者至少购买了一种正版词典或光盘,然后大家再共享以正版词典资料为基础的电子版词典,参与部分汉译录入或校对的工作。这样不至于资源大量流出,而且社区内可以协作把电子版做的更完整更专业。 |
|