|
本帖最后由 lgmcw 于 2019-11-11 03:23 编辑
O7我原来有提取过,从光盘rip出来的原始品质的mp3,比高度压缩的spx效果好很多,都按单词名命名好了,拿来制作发音库很容易,不过只有英音。
我这里有一套2015年做的英音的语音库,当时是嫌我用的两个背单词的网站(wordmemo和扇贝网)没有英音,才下决心做的。他们的老板都已经采用这一套英音了 [注:扇贝网后来购买了版权更换成了纯牛津的发音。]
总的来说,前后花了一周时间才做好。原始mp3数据是直接从各大词典的光盘或者网页版上提取的。为了高音质,也完全没有转码。然后最麻烦的一步是,通过解密和分析源词典光盘的数据结构,终于修改成单词拼写即是相应MP3文件名的形式。
具体使用的词典库有:
1. 朗当代第五版(我认为朗文的发音是最地道的,同时也很清晰。最新的第六版没有光盘了,只有一个网站,我去抓了一些mp3发现完全和第五版一样)。
2. 朗文发音词典(非常霸道,揉选了朗文第345版+学习词典+各种词典+数万独占的录音,朗文发音看家之作。和上面朗文当代有一些交集)。
3. 朗文当代第四版2005增补(其中朗文当代第三和第四版都出过增补版,就是所谓的四代半。只有这个版本网上广泛流传,电驴上可以下载。MDICT上一版的sound.mdd的英音基本上基于此语音库。不过因为年代原因,绝大多数发音和第五版相同,但是音质低不少,我全拿新版做替换,稍后解释)。
4. 牛津高阶第七版(第七版的录音虽然有男有女,但是我觉得其实比第八版更好)。
5. 牛津高阶第八版(第八版的录音牛津完全重新录过,不过我觉得那个男声实在欠点儿味道)。 [注:o8发音=o9=ODE online]
至于网上流传的金山词霸(提取自爱词霸网页)发音,我听了一下,很多是国人朗读的,并且有很多杂音、短音,质量实在是不咋地,我果断弃用。虽然以上入选的语音库都一流级别的,但是毕竟一个单词只需要一个读音,所以我筛选了一遍,做成一一对应的语音库(当然有少量重复的,实在懒得删了)。根据我个人的主观评价,用质量更高的发音库代替稍逊色的。
优先级如下(前面覆盖后面的):1.朗文五 > 2.朗文发音 > 4.牛津七 > 5.牛津八 > 3.朗文四2005
Azure
7天有效,恕不补档。O7英音MP3链接: https://pan.baidu.com/s/1zlsFqwIr66i13tqH4E42Eg 提取码: 7nv1 |
|