查看: 5375|回复: 22
打印 上一主题 下一主题

[英英] 朗文5完整语音库

[复制链接]
  • TA的每日心情

    2020-5-13 08:44
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    2

    主题

    24

    回帖

    441

    积分

    秀才

    Rank: 3Rank: 3

    积分
    441
    跳转到指定楼层
    1
    发表于 2010-11-29 00:10:04 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 mk200 于 2010-11-29 23:25 编辑

    但是,在文件名的命名上,现在有点犯难,因为有一部分对应关系为,同一单词,不同词性,MP3文件不同。即一对多。如果我把文件名命名为单词+词性,方便应用在各个DIY词典以及SUPERMEMO上吗? 如果这样命名了。那些一对一的单词,命名方式为单词.mp3。两者看起来又不统一。给制作其他材料时带来麻烦。大伙给出出主意吧。
    ————————————————————————————————
    晚上更新:
    今天重新想了,首先,网上现有的语音库已经相当齐全,自己这么转换,无非是想解决一对多问题,即使找到了最佳改名方式,和现有词典还是不兼容的。倒不如,语音文件名不改,利用单词与语音文件的对应关系。直接处理词典文本,得到相对完美的结果,由此看来。之前设想的改名问题,倒成了多此一举的事情 ,公开朗文5单词MP3文件对应关系,这个表,应该是比较完美的,我仔细检查多遍,暂时没有发现错误。
    格式为单词TAB词性(无词性则留空)TABMP3文件名

    美音.rar

    341.44 KB, 下载次数: 666, 下载积分: 米 -5 粒

    英音.rar

    327.25 KB, 下载次数: 420, 下载积分: 米 -5 粒

    本帖被以下淘专辑推荐:

  • TA的每日心情

    2020-5-13 08:44
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    2

    主题

    24

    回帖

    441

    积分

    秀才

    Rank: 3Rank: 3

    积分
    441
    2
     楼主| 发表于 2010-11-29 00:10:58 | 只看该作者
    补充下,朗文语音数据的单词名与实际MP3文件名不同。

    该用户从未签到

    34

    主题

    202

    回帖

    832

    积分

    禁止发言

    积分
    832
    3
    发表于 2010-11-29 00:44:17 | 只看该作者
    今晚没白晚睡啊,看到这么好的消息,太支持你了!你真是太给力了!不过,你说的问题我也不知道该怎么解决,希望大家群策群力啊。

    该用户从未签到

    53

    主题

    474

    回帖

    2635

    积分

    解元

    Rank: 5Rank: 5

    积分
    2635
    4
    发表于 2010-11-29 04:17:44 | 只看该作者
    同一单词,不同词性,且MP3文件不同的,保留一个mp3文件即可。
  • TA的每日心情

    2020-5-13 08:44
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    2

    主题

    24

    回帖

    441

    积分

    秀才

    Rank: 3Rank: 3

    积分
    441
    5
     楼主| 发表于 2010-11-29 08:32:32 | 只看该作者
    同一单词,不同词性,且MP3文件不同的,保留一个mp3文件即可。
    zcm1019 发表于 2010-11-29 04:17

    这样总感觉有点遗憾,毕竟有的词不同词性的发音不同,网上现有朗文音库基本就是删了部分发音文件与网上其他版本的语音做了合并,
    朗文音库最大特点就是清晰,我很想做的完美点。大伙给点意见吧

    该用户从未签到

    45

    主题

    1420

    回帖

    1万

    积分

    管理员

    Rank: 13Rank: 13Rank: 13Rank: 13

    积分
    10971

    管理组专用章

    6
    发表于 2010-11-29 09:34:51 | 只看该作者
    本帖最后由 rayman 于 2010-11-29 09:37 编辑

    1. 把同名的用统一的规则加个词性后缀,保留一份标准的,例如 abc 有abc.mp3, abc(vt).mp3, abc(n).mp3. 如果还想在同一个词典里支持美音和英音,就默认英音,再增加一个美音后缀,例如abc(vt)_us.mp3之类的形式。虽然产生了冗余,但应该量不大吧?或者做两份语音库来区分美音或者英音。
    2. 修改(或增加)词典正文中的发音链接,根据词性指向不同的发音。用户可以利用点击不同的发音链接来听不同的词性发音。(发音链接的写法类似于普通链接,只是src里的写法是"sound://abc(n).spx" 这样)。
    3. 可以的话将单词列表和语音文件对照列表同时公布出来。如果其他人也可以利用这个语音库了。
    4. 如果能有一个比较合理的后缀名格式定义,可以考虑扩展mdict,直接支持这类特殊的发音。

    该用户从未签到

    0

    主题

    417

    回帖

    6416

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    6416

    笑傲江湖章灌水大神章

    7
    发表于 2010-11-29 09:39:31 | 只看该作者
    支持下!
  • TA的每日心情

    2020-5-13 08:44
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    2

    主题

    24

    回帖

    441

    积分

    秀才

    Rank: 3Rank: 3

    积分
    441
    8
     楼主| 发表于 2010-11-29 10:17:03 | 只看该作者
    1. 把同名的用统一的规则加个词性后缀,保留一份标准的,例如 abc 有abc.mp3, abc(vt).mp3, abc(n).mp3. 如果还想在同一个词典里支持美音和英音,就默认英音,再增加一个美音后缀,例如abc(vt)_us.mp3之类的形式。虽 ...
    rayman 发表于 2010-11-29 09:34

    主意相当不错。冗余不大,我统计过,朗文5中,4万多单词,发音不同的冗余只有1000多个。
    大家可以讨论下,就制作词典时,怎么能方便的调用这类发音不同文件,商讨确定一个关于一对多发音文件,以及英音美音命名的标准。
  • TA的每日心情

    2020-5-13 08:44
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    2

    主题

    24

    回帖

    441

    积分

    秀才

    Rank: 3Rank: 3

    积分
    441
    9
     楼主| 发表于 2010-11-29 10:23:43 | 只看该作者
    1. 把同名的用统一的规则加个词性后缀,保留一份标准的,例如 abc 有abc.mp3, abc(vt).mp3, abc(n).mp3. 如果还想在同一个词典里支持美音和英音,就默认英音,再增加一个美音后缀,例如abc(vt)_us.mp3之类的形式。虽 ...
    rayman 发表于 2010-11-29 09:34

    版主,你的这个想法不错。但是有一点,abc(vt) abc(n)发音很可能相同的,指向同一MP3文件即可,朗文5数据中发音不同的只有一千多个,即只命名发音不同的文件即可,这样的话冗余不大,但处理词典数据时,我觉得,还是有难度的。正则表达式很难识别出哪个单词的一对多不同(abc vt->abc(vt).mp3,abc n ->abc(n).mp3),哪个的一对多是相同(abc vt ->abc.mp3,abc n->abc.mp3) 如果把不管发音是否相同,全部命名为abc(vt).mp3 abc(n).mp3,冗余太大了。
  • TA的每日心情

    2020-5-13 08:44
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    2

    主题

    24

    回帖

    441

    积分

    秀才

    Rank: 3Rank: 3

    积分
    441
    10
     楼主| 发表于 2010-11-29 10:33:53 | 只看该作者
    对应关系表是完成了。不过重命名工作还没完成。公布出来大伙应该也用不上,等命名全部结束了。我就公开了。现在感觉不完美
  • TA的每日心情
    慵懒
    2020-12-11 08:19
  • 签到天数: 104 天

    [LV.6]常住居民II

    30

    主题

    2044

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11260

    灌水大神章小蜜蜂章笑傲江湖章

    11
    发表于 2010-11-29 11:06:55 | 只看该作者
    不知能否把一词对多音情况的mp3文件合并为一个文件,这种现象在现有的语音库里面就存在,如某单词(我记不得具体的例子了)点发音后会听到:'a' or 'b'.(a,b代表的是两个不同的发音)。
  • TA的每日心情
    郁闷
    2018-3-3 19:50
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    10

    主题

    517

    回帖

    1888

    积分

    解元

    Rank: 5Rank: 5

    积分
    1888

    灌水大神章

    12
    发表于 2010-11-29 22:30:50 | 只看该作者
    虽然帮不上忙,但还是要支持一下。{:3_57:}
  • TA的每日心情

    2020-5-13 08:44
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    2

    主题

    24

    回帖

    441

    积分

    秀才

    Rank: 3Rank: 3

    积分
    441
    13
     楼主| 发表于 2010-11-29 23:07:38 | 只看该作者
    今天重新想了,首先,网上现有的语音库已经相当齐全,自己这么转换,无非是想解决一对多问题,即使找到了最佳改名方式,和现有词典还是不兼容的。倒不如,语音文件名不改,利用单词与语音文件的对应关系。直接处理词典文本,得到相对完美的结果,由此看来。之前设想的改名问题,倒成了多此一举的事情
  • TA的每日心情
    开心
    2022-7-22 10:15
  • 签到天数: 2 天

    [LV.1]初来乍到

    1

    主题

    70

    回帖

    218

    积分

    童生

    Rank: 2

    积分
    218
    14
    发表于 2011-6-8 21:10:06 | 只看该作者
    真是高人。汗一个

    该用户从未签到

    1

    主题

    12

    回帖

    61

    积分

    童生

    Rank: 2

    积分
    61
    15
    发表于 2011-8-16 22:12:31 | 只看该作者
    为什么这么小呢?
  • TA的每日心情
    郁闷
    2018-3-3 19:50
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    10

    主题

    517

    回帖

    1888

    积分

    解元

    Rank: 5Rank: 5

    积分
    1888

    灌水大神章

    16
    发表于 2011-8-17 22:20:21 | 只看该作者
    期待高手早日成功。

    该用户从未签到

    1

    主题

    19

    回帖

    131

    积分

    童生

    Rank: 2

    积分
    131
    17
    发表于 2012-8-14 16:15:13 | 只看该作者
    这个给来干嘛用的啊?

    该用户从未签到

    0

    主题

    130

    回帖

    270

    积分

    被盗用户

    积分
    270
    18
    发表于 2012-8-29 22:11:07 | 只看该作者
    支持一下!

    该用户从未签到

    0

    主题

    9

    回帖

    10

    积分

    童生

    Rank: 2

    积分
    10
    19
    发表于 2012-9-3 00:06:55 | 只看该作者
    语音库mp3在哪里呢

    该用户从未签到

    0

    主题

    27

    回帖

    27

    积分

    童生

    Rank: 2

    积分
    27
    20
    发表于 2013-3-12 23:14:49 | 只看该作者
    虽然帮不上忙,但还是要支持一下