查看: 1144|回复: 5
打印 上一主题 下一主题

[讨论] 语音库软件的想法

[复制链接]

该用户从未签到

40

主题

177

回帖

1628

积分

版主

Rank: 10Rank: 10Rank: 10

积分
1628

灌水大神章小蜜蜂章笑傲江湖章管理组专用章

跳转到指定楼层
1
发表于 2014-10-11 17:05:30 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
首先,抱歉这个贴子与Mdict无关。
纯提个建议,希望引起软件大神的注意。
如果不符合发贴要求,麻烦版主删除即可。

去年发过一个帖子《 柯林斯、朗文、牛津、剑桥双解TXT版-【自备语料库】》,很意外受到大家的欢迎。
当时想的只是利用一些权威词典的例句,做一个庞大的语料库。
这只是一定程度上便于提高“读”和“写”的能力。

现在想立足于“听”和“说”的能力。

因为手头上有朗文词典2005的真人例句朗读文件(近10万个例句),同时也获得了国外一个Tatoeba项目12万的真人例句发音。
这对于练习英语听说是个好材料,可惜缺少一个方便的检索工具。

不管是朗文那个也好,还是Tatoeba,下载的音频都是以数字编号命名的MP3文件。文本存在于其他文件下。
这样检索起来就有点麻烦。
如果我想查找有关school的真人朗读,首先需要查找文本,得到数字编号。再后数字编号去找到相应的音频。

如果可以将TXT文本与MP3联系起来,在查找某个单词时一步到位,这就方便多了。

在听说方面,我一直在用一个叫Aboboo的软件。
它里面有个句库功能,可以依照规定格式批量导入这些音频。倒是可以通过文本搜索,直接查找到相应的音频例句。
但是,它的功能略显简单,不管是查找,还是查找结果的呈现,都不大令我满意。

我希望能有这么一款语音库的软件:
1、批量导入文本和相应音频。
2、通过检索某个单词,得到所有句子及音频。
3、不需要借助第三方播放器就可以听句子。
4、检索方面最好引入正则表达式,以便于更精确搜索。
5、因为以后还打算通过电影音频及字幕、VOA、EnglisPod、新概念等听力材料制作成更多语音语料,所以最好也可以通过MP3歌词文件LRC直接导入。

以上是我的一点想法,因为不懂制作软件,一直实现不了。
如果大神有意,可参照Aboboo的相关功能。

该用户从未签到

21

主题

82

回帖

775

积分

版主

Rank: 10Rank: 10Rank: 10

积分
775

管理组专用章

3
发表于 2014-10-16 14:52:53 | 只看该作者
使用 fastwiki 即可实现这个功能, 详见最新的发布:
https://www.pdawiki.com/forum/thread-13207-1-1.html

该用户从未签到

40

主题

177

回帖

1628

积分

版主

Rank: 10Rank: 10Rank: 10

积分
1628

灌水大神章小蜜蜂章笑傲江湖章管理组专用章

4
 楼主| 发表于 2014-10-17 05:53:20 | 只看该作者
fastwiki 发表于 2014-10-16 14:52
使用 fastwiki 即可实现这个功能, 详见最新的发布:
https://www.pdawiki.com/forum/thread-13207-1-1.html

唉,对我来说,太复杂了,看得一头雾水

该用户从未签到

21

主题

82

回帖

775

积分

版主

Rank: 10Rank: 10Rank: 10

积分
775

管理组专用章

5
发表于 2014-10-17 08:05:03 | 只看该作者
LYX1692 发表于 2014-10-17 05:53
唉,对我来说,太复杂了,看得一头雾水

1. 不会有一款软件直接能满足你说的功能的,
Fastwiki 能实现这个功能, 但是需要写上那么几行的 lua 代码.
这是因为, 文本格式是有无穷种的, 比如你的文本格式很可能是:

xxx.mp3  一条句子

那么别的文本格式很可能又是:
xxx.mp3:
一条句子
又一条句子

要实现如此多种格式是很困难的.

2. fastwiki 已经把大家从编辑器中解放出来了, 大家要做的只是学一下几行 lua,
大家只要相信我, 花上几个小时, 很容易就学会了. 很多时候就在于你相信或不相信,
你相信, 然后去做, 就得到了. 我的 "lua 语言入门" 也是花了一天的时间来写的,
目的就是为了让大家制作任意格式的词典, 也是为了让大家自由发挥.

3. 如果你觉得 fastwiki 的工具太复杂了, 也没有看过 https://fastwiki.me/index.php/Howto_learn_lua/zh
又想实现这个功能的话, 唯一的方法就是把你的 mp3, 以及文本, 和功能要求,
打包共享出来,  才有可能有网友帮你制作.  另外, 可以加入 :
    fastwiki 数据制作 & 使用 qq 群: 173327815

该用户从未签到

40

主题

177

回帖

1628

积分

版主

Rank: 10Rank: 10Rank: 10

积分
1628

灌水大神章小蜜蜂章笑傲江湖章管理组专用章

6
 楼主| 发表于 2014-10-17 15:27:47 | 只看该作者
fastwiki 发表于 2014-10-17 08:05
1. 不会有一款软件直接能满足你说的功能的,
Fastwiki 能实现这个功能, 但是需要写上那么几行的 lua 代码 ...

谢谢,今天静下心来,好好摸索了一下,比明天稍有进步了,知道如何测试lua了。
但还是碰到许多问题。

可否以7个mp3文件来作一个简单说明呢?

语音包我正在上传,以后会共享出来。

但我还是希望可以自己学到实际的操作方法,因为我只要听英语材料,自建的语音库随时都在增加。

http://pan.baidu.com/s/1nt7KSyt