|
在论坛转了一圈,似乎没有人发这方面的东西,自己捣鼓出一个
一、为什么要去声音?
原因1:手机的容量有限,主流的几个词典比如朗文5,mdd文件有1G多,放在手机上本人表示压力很大
原因2:现在许多词典都有声音,个人认为有一个带声的足以,没必要每个都带声,纯浪费空间
自测去掉声音后mdd文件大小可以降为原先的20%
二、反编译mdx/mdd,取得原始txt和data数据
目前通行的做法似乎是采用yhssdl大侠的Getdict,确实强大,佩服
代码貌似没公开。从已经生成的txt和data着手处理固然可以,不过总觉得方法不够优雅
如果在反编译的同时顺便把声音给去了,岂不是更好?
于是用度娘找啊找,终于在newsmth上找到个牛人kingson写的python,可以做和Getdict同样的工作,
且代码是公开的。小改几行,收工。
原始代码在这里:
https://bitbucket.org/xwang/mdict-analysis/src
本人修改过的见附件,搜下面关键字即可看到我加的代码
###bt4baidu add start
###bt4baidu add end
不会用python请找度娘,本人今天第一次用python。从搭环境到完工一共花半天不到。
强烈推荐用ulipad,体积小,超轻量,编辑调试手感很赞,还带个动态正则表达式环境
三、编译mdx/mdd
这个就不废话了,直接上Rayman大婶的MdxBuilder
注意:
1、仅测试了手头有的几个词库,如果遇到例外情况请自行改代码解决,主要是改那个去html声音链接的正则表达式
2、查看反编译出的data目录最好用cmd命令行方式,文件多,打开一次要等半天
3、本人比较忙,且比较懒,不常来,有问题可能不会及时回答
4、安装文本和目录比较工具,如beyondcompare,方便校对
5、干活之前做好备份。计算机小白就不要轻易尝试了,最好请在坛里找高手帮忙(美女可以找我 )
|
-
-
rmsnd.zip
166.62 KB, 下载次数: 173, 下载积分: 米 -5 粒
去声音py脚本
评分
-
1
查看全部评分
-
|