查看: 2444|回复: 18
打印 上一主题 下一主题

[工具] 发个给mdd文件去声音的程序,python写的

[复制链接]

该用户从未签到

59

主题

960

回帖

8774

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
8774

灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

跳转到指定楼层
1
发表于 2014-5-26 22:42:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

在论坛转了一圈,似乎没有人发这方面的东西,自己捣鼓出一个

一、为什么要去声音?

原因1:手机的容量有限,主流的几个词典比如朗文5,mdd文件有1G多,放在手机上本人表示压力很大
原因2:现在许多词典都有声音,个人认为有一个带声的足以,没必要每个都带声,纯浪费空间

自测去掉声音后mdd文件大小可以降为原先的20%

二、反编译mdx/mdd,取得原始txt和data数据

目前通行的做法似乎是采用yhssdl大侠的Getdict,确实强大,佩服
代码貌似没公开。从已经生成的txt和data着手处理固然可以,不过总觉得方法不够优雅
如果在反编译的同时顺便把声音给去了,岂不是更好?
于是用度娘找啊找,终于在newsmth上找到个牛人kingson写的python,可以做和Getdict同样的工作,
且代码是公开的。小改几行,收工。

原始代码在这里:
https://bitbucket.org/xwang/mdict-analysis/src

本人修改过的见附件,搜下面关键字即可看到我加的代码
###bt4baidu add start
###bt4baidu add end

不会用python请找度娘,本人今天第一次用python。从搭环境到完工一共花半天不到。
强烈推荐用ulipad,体积小,超轻量,编辑调试手感很赞,还带个动态正则表达式环境

三、编译mdx/mdd

这个就不废话了,直接上Rayman大婶的MdxBuilder

注意:
1、仅测试了手头有的几个词库,如果遇到例外情况请自行改代码解决,主要是改那个去html声音链接的正则表达式
2、查看反编译出的data目录最好用cmd命令行方式,文件多,打开一次要等半天
3、本人比较忙,且比较懒,不常来,有问题可能不会及时回答
4、安装文本和目录比较工具,如beyondcompare,方便校对
5、干活之前做好备份。计算机小白就不要轻易尝试了,最好请在坛里找高手帮忙(美女可以找我

rmsnd.zip

166.62 KB, 下载次数: 173, 下载积分: 米 -5 粒

去声音py脚本

评分

1

查看全部评分

本帖被以下淘专辑推荐:

  • TA的每日心情
    开心
    2018-3-19 02:23
  • 签到天数: 1 天

    [LV.1]初来乍到

    16

    主题

    117

    回帖

    711

    积分

    举人

    Rank: 4

    积分
    711
    推荐
    发表于 2017-1-31 12:40:18 | 只看该作者
    HTTPOPPP 发表于 2017-1-31 11:32
    可是mdd文件有时候也会包括词条.

    词条全部在mdx,其实mdx就相当于HTML。常见的是:mdd有某些词条的图片
  • TA的每日心情
    开心
    2021-4-9 21:23
  • 签到天数: 48 天

    [LV.5]常住居民I

    6

    主题

    270

    回帖

    1466

    积分

    解元

    Rank: 5Rank: 5

    积分
    1466

    灌水大神章

    2
    发表于 2014-5-26 23:34:32 | 只看该作者
    谢谢分享!!!

    该用户从未签到

    3

    主题

    169

    回帖

    1858

    积分

    解元

    Rank: 5Rank: 5

    积分
    1858

    灌水大神章小蜜蜂章笑傲江湖章

    3
    发表于 2014-5-27 10:26:12 | 只看该作者
    删除了那个最大的mdd文件一般就搞定了

    该用户从未签到

    12

    主题

    407

    回帖

    1万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    11211

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    4
    发表于 2014-5-27 11:42:19 | 只看该作者
    原作者不是xwang么 什么时候变成newsmth上找到个牛人kingson了- -
    https://www.pdawiki.com/forum/fo ... hread&tid=10619

    该用户从未签到

    59

    主题

    960

    回帖

    8774

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    8774

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    5
     楼主| 发表于 2014-5-27 12:39:37 | 只看该作者
    meigen 发表于 2014-5-27 11:42
    原作者不是xwang么 什么时候变成newsmth上找到个牛人kingson了- -
    https://www.pdawiki.com/forum/forum.ph ...

    xwang就是kingson,kingson就是xwang

    该用户从未签到

    59

    主题

    960

    回帖

    8774

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    8774

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    6
     楼主| 发表于 2014-5-27 13:58:14 | 只看该作者
    用这个py脚本貌似能解开getdict无法处理的加密过的mdx

    另外getdict有些小bug,从mdd文件解出data时,有时候好像会写入垃圾数据,不过不影响浏览

    附件是两个例子,比较大的那个getdict生成的,小的是py脚本生成的,用二进制比较可以看出来

    pic.zip

    110.38 KB, 下载次数: 18, 下载积分: 米 -5 粒

    该用户从未签到

    34

    主题

    755

    回帖

    2705

    积分

    解元

    Rank: 5Rank: 5

    积分
    2705

    灌水大神章小蜜蜂章笑傲江湖章

    7
    发表于 2014-6-1 00:54:30 | 只看该作者
    正在学Python……
  • TA的每日心情
    奋斗
    2021-9-21 18:07
  • 签到天数: 167 天

    [LV.7]常住居民III

    4

    主题

    375

    回帖

    5080

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    5080

    灌水大神章

    8
    发表于 2014-9-28 23:23:39 | 只看该作者
    谢谢分享,很实用,正想学习一下~

    该用户从未签到

    9

    主题

    92

    回帖

    702

    积分

    举人

    Rank: 4

    积分
    702

    灌水大神章小蜜蜂章笑傲江湖章

    9
    发表于 2014-11-4 20:49:47 | 只看该作者
    想用LDOCE5,又苦恼于文件太大,这下全解决了,赞~~~

    该用户从未签到

    23

    主题

    553

    回帖

    4546

    积分

    贡士

    Rank: 6Rank: 6

    积分
    4546
    10
    发表于 2014-11-14 11:19:54 | 只看该作者
    收藏备用,谢谢.
  • TA的每日心情
    开心
    2018-10-3 08:04
  • 签到天数: 127 天

    [LV.7]常住居民III

    2

    主题

    62

    回帖

    1532

    积分

    解元

    Rank: 5Rank: 5

    积分
    1532

    灌水大神章

    11
    发表于 2016-11-22 09:43:52 | 只看该作者
    去声音之后有什么存在的意义

    点评

    因为有的人喜欢用独立的声音库.  发表于 2017-1-31 11:32
  • TA的每日心情
    开心
    2018-12-9 08:17
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    1

    主题

    149

    回帖

    1195

    积分

    解元

    Rank: 5Rank: 5

    积分
    1195

    灌水大神章

    12
    发表于 2016-11-22 19:25:16 | 只看该作者
    bt4baidu真了不起!
  • TA的每日心情
    开心
    2018-4-26 16:40
  • 签到天数: 2 天

    [LV.1]初来乍到

    31

    主题

    236

    回帖

    6万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    63987

    灌水大神章

    13
    发表于 2017-1-31 11:32:50 | 只看该作者
    reuse 发表于 2014-5-27 10:26
    删除了那个最大的mdd文件一般就搞定了

    可是mdd文件有时候也会包括词条.

    该用户从未签到

    0

    主题

    4

    回帖

    225

    积分

    秀才

    Rank: 3Rank: 3

    积分
    225
    16
    发表于 2017-2-8 22:18:02 | 只看该作者
    这个真是不错。
  • TA的每日心情
    擦汗
    2018-8-21 14:27
  • 签到天数: 10 天

    [LV.3]偶尔看看II

    0

    主题

    150

    回帖

    180

    积分

    童生

    Rank: 2

    积分
    180
    17
    发表于 2018-3-1 10:19:33 | 只看该作者
    竟然还有这么好的程序  必须实用下
  • TA的每日心情
    开心
    2018-8-5 09:45
  • 签到天数: 108 天

    [LV.6]常住居民II

    0

    主题

    29

    回帖

    645

    积分

    举人

    Rank: 4

    积分
    645
    18
    发表于 2018-3-2 10:49:20 | 只看该作者
    顶,支持
    支持好作品哈哈哈哈哈