词库的词头词表啥的有的是,挑个自己顺眼的,解释呢,愿意摘录已有的mdx的,也有现成的mdx解析工具,兴致好的话,可以写代码网上爬,爬虫类的工具有的是,难点不是网络访问,是如何跳过对方服务器端的屏蔽设置,至于声音,有有资源的话,可以摘,没资源的话,可以利用声音引擎利用代码生成.大概的流程也就这样,最耗费精力的就是原始数据源,如果一条条自己折腾的话,光校对就能累死人,而且按照楼主的模式,一个单词一个声音文件,甚至一个例句或者若干个例句片段都得对应一个声音文件的话,光最后汇总到一起的声音文件估计就得是一大坨....,个人理解的东西大概流程也就是这样,感兴趣的话,论坛里有对应的技术贴,可以自己看看. |