本帖最后由 小明爱单词 于 2020-1-22 13:40 编辑
Text-to-speech就是常说的tts服务,常见的应用场景如电子书机器朗读、智能助手(siri)等。
完美的tts服务意味着所有的文本都是理想的听力资源,是不是非常梦幻?
(题外话,我自己算是英语终生学习者,日常高频看论文、各类pdf、网站,再为了英语学习单独找听力素材基本不现实,素材也不一定都理想,比如the economist很好,但也却是英英。TTS可以说是最高效、全面、可持续的学习方式。)
开发alpha-go的Deepmind团队采用深度学习方法Wavenet革新了tts技术(https://deepmind.com/blog/wavenet-generative-model-raw-audio/),效果惊人!
鉴于很多朋友并没有范强工具,我这里随便做了个sample大家感受一下。
Sample:Longman Dictionary of Contemporary English is an advanced learner's dictionary, providing definitions by using a restricted vocabulary, helping non-native English speakers to understand meanings easily.
链接:https://pan.baidu.com/s/1Yv88OFBCoaAcOsIynuqgpQ
2018年3月底该api的beta版本正式上线(https://cloud.google.com/text-to-speech/),我就持续关注,4月下旬终于在chrome上出现了可以调用该api的插件Speechy,经过一周左右的体验使用,非常理想!
对谷歌来说,本文内容的大范围使用极可能属于滥用行为,请各位不要转载该教程,像Mdict一样低调的造福真正需要的人。详细教程(非必要,流程很简明)在二楼。 本帖隐藏的内容gctts
更新: 由于speechy插件暂时不支持pdf和word文件的识别,所以这两类文件的语音阅读要借助html转换。对于排版简单的文件,可以直接使用word或acrobat pro中自带的“导出到html”功能,对于排版比较复杂的pdf(如英文论文、杂志)建议使用迅捷等较为专业的转化工具,可以完全保留原始排版样式。
Alert:暂时不要升级Speechy至v0.1.3版本,部署了变速功能,但是可能作者没留意,取消了插件访问文件网址的授权,不能识别本地html文件。
安卓手机上目前只能通过使用 Yandex浏览器安装插件来实现该功能。
目前最好用的调用插件是wavenet for chrome。
|