查看: 596|回复: 10
打印 上一主题 下一主题

[求助] 可否实现例句或短语的真人发音?

[复制链接]

该用户从未签到

47

主题

323

回帖

1万

积分

状元

Rank: 9Rank: 9Rank: 9

积分
11400

灌水大神章小蜜蜂章笑傲江湖章

跳转到指定楼层
1
发表于 2016-6-17 08:34:10 来自手机 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 qiuhao1112 于 2016-6-17 08:35 编辑

遇到一个真人发音的问题,比如:
derogatory term.
真人语音库里面有真人发音的 derogatory和term单独音频文件,用什么方法才能实现把这两个单词的独立发音联合起来按 derogatory term先后顺序一起发音呢?

1.软件自动识别,先后按顺序在语音库里查找音频文件然后播放
2.音频文件合并,然后实现联合发音

有什么方法能实现吗?
  • TA的每日心情
    慵懒
    2023-2-4 11:26
  • 签到天数: 579 天

    [LV.9]以坛为家II

    12

    主题

    1027

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    12103

    灌水大神章

    2
    发表于 2016-6-18 08:49:27 | 只看该作者
    小白一个。只能帮楼主顶帖

    该用户从未签到

    13

    主题

    194

    回帖

    2101

    积分

    解元

    Rank: 5Rank: 5

    积分
    2101

    灌水大神章小蜜蜂章笑傲江湖章

    3
    发表于 2016-6-18 10:05:53 | 只看该作者
    本帖最后由 idict 于 2016-6-18 10:11 编辑

    尝试理解楼主的问题, 不知是否正确.
    (如果用单词发音文件组成例句或短语. 可能有语调的问题吧. 因单词的发音多数是降调)
    楼主提到的方法一, 如果会写代码. 当然是好啦. 那将是真人TTS引擎. 很是期待.
    方法二, 有很多软件可以做到音频文件的合并. Audacity是一个开源软件, 对录音和编辑的功能都很强. 对mp3的编辑是没有问题的.
    http://www.audacityteam.org/download/

    如果用DOS的copy命令b选项也相当简单, 但前提必须是相同编码率和采样率, 而且没有标签信息等的纯音频mp3
    因为不同编码率的音频文件以二进制方式合并后, 很是考验播放器的容错能力的. 所以方法二里好的合并软件编辑完之后的音频输出都是重新编码的.
    (刚才试了一下spx, 也可用拷贝合并. 用foobar2000也可以播放. 只是编码信息和时间等就显示不正确了)

    假设: 在目录 r:\downloads\data 里有相同的44.1kHz, 128kbps的derogatory.mp3和term.mp3, 而且没有任何的标签信息的纯mp3文件. (相同的22.05kHz, 24kbps的也可以的, 只要是全部一致, 合并后就可以正常播放的.)
    打开cmd.exe命令行窗口, 输入命令copy带b选项(二进制), 拷贝合并到derogatory term.mp3
    1. copy "r:\downloads\data\derogatory.mp3" /b + "r:\downloads\data\term.mp3" /b "r:\downloads\data\derogatory term.mp3"
    复制代码

    该用户从未签到

    47

    主题

    323

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11400

    灌水大神章小蜜蜂章笑傲江湖章

    4
     楼主| 发表于 2016-6-24 11:55:21 来自手机 | 只看该作者
    本帖最后由 qiuhao1112 于 2016-6-24 11:57 编辑
    idict 发表于 2016-6-18 10:05
    尝试理解楼主的问题, 不知是否正确.
    (如果用单词发音文件组成例句或短语. 可能有语调的问题吧. 因单词的发 ...


    不好意思,回复晚了。。谢谢认真回答。

    音频合并这个办法我觉得太笨拙,产生语音发音过程缓慢繁琐,不考虑这种方式

    我的构思是:用Python写代码 + 语音文件 + 文字文本txt  应该能实现真人发音,不过暂时没有精力研究这个,以后有闲暇时间l会考虑尝试一下

    该用户从未签到

    13

    主题

    194

    回帖

    2101

    积分

    解元

    Rank: 5Rank: 5

    积分
    2101

    灌水大神章小蜜蜂章笑傲江湖章

    5
    发表于 2016-6-28 11:21:00 | 只看该作者
    你客气了. 没有关系.
    确实是没有透彻理解你的核心内容.

    该用户从未签到

    0

    主题

    40

    回帖

    53

    积分

    童生

    Rank: 2

    积分
    53
    6
    发表于 2016-7-9 14:56:25 | 只看该作者

    谢谢分享啊
  • TA的每日心情
    开心
    2020-6-12 14:43
  • 签到天数: 67 天

    [LV.6]常住居民II

    0

    主题

    291

    回帖

    2845

    积分

    解元

    Rank: 5Rank: 5

    积分
    2845

    灌水大神章

    7
    发表于 2016-7-10 21:41:17 | 只看该作者
    小白一个。只能帮楼主顶帖

    该用户从未签到

    1

    主题

    119

    回帖

    554

    积分

    举人

    Rank: 4

    积分
    554
    8
    发表于 2016-7-15 13:24:41 | 只看该作者
    可以自动检索26个字母 随意组合。发出任意想要的单词 短语 句子。是这个意思么。曾经这样想过。。。比如presentation。。更地道一些。。
  • TA的每日心情

    2022-4-5 15:20
  • 签到天数: 32 天

    [LV.5]常住居民I

    15

    主题

    185

    回帖

    6143

    积分

    会元

    岁月如心,终会淡然

    Rank: 7Rank: 7Rank: 7

    积分
    6143

    灌水大神章小蜜蜂章笑傲江湖章推广专家

    10
    发表于 2016-11-23 20:18:44 | 只看该作者
    这个我之前用CMD实现过,但是出现一个问题,就是两个单词的时间间隔以及语气,比如A是男声,B是女生,AB一起就不是了。
    另外,因为权限比较低,想看你发布的30权限的贴子,不知道怎么看。
  • TA的每日心情

    2022-4-5 15:20
  • 签到天数: 32 天

    [LV.5]常住居民I

    15

    主题

    185

    回帖

    6143

    积分

    会元

    岁月如心,终会淡然

    Rank: 7Rank: 7Rank: 7

    积分
    6143

    灌水大神章小蜜蜂章笑傲江湖章推广专家

    11
    发表于 2016-11-23 20:26:49 | 只看该作者
    我是用ffmpeg分析音频,然后把音频都保存为tmp文件,然后用,ffmpeg再组合成一个音频。