查看: 1472|回复: 10
打印 上一主题 下一主题

[求助] 请教下大神们mdx词典的数据结构是怎样的?想提取数据

[复制链接]

该用户从未签到

1

主题

25

回帖

33

积分

童生

Rank: 2

积分
33
跳转到指定楼层
1
发表于 2013-5-13 10:53:31 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
我想做个SuperMemo UX的背单词词库,但是释义比较难整,就想从mdx词典内提取数据。
SM UX用的是xml语言的,之前用GetDict(2.3版)从mdx词典里提取出html的文本,本来都转成xml了,弄得差不多了才发现提取出的数据有点问题,很多地方缺空格,出现连词现象,还有不少错误,个人有点完美控,所以想自己写个小软件提取mdx内的数据,但不知词典内的数据是如何压缩编排的?求各位高手开导!

该用户从未签到

47

主题

360

回帖

831

积分

举人

Rank: 4

积分
831
2
发表于 2013-5-13 11:17:23 | 只看该作者
高技术的活儿,祝好运!

该用户从未签到

1

主题

25

回帖

33

积分

童生

Rank: 2

积分
33
3
 楼主| 发表于 2013-5-13 11:35:37 | 只看该作者
2# 莲花无语

谢谢!继续等高手

该用户从未签到

2

主题

52

回帖

2505

积分

解元

Rank: 5Rank: 5

积分
2505
4
发表于 2013-5-13 11:50:37 | 只看该作者
为什么会缺空格,出现连词现象呢?

该用户从未签到

1

主题

25

回帖

33

积分

童生

Rank: 2

积分
33
5
 楼主| 发表于 2013-5-13 13:50:50 | 只看该作者
4# xngnln


我也很想知道,毕竟不是全部词都这样,还有一些乱码,而且没找全规律,处理比较棘手。

该用户从未签到

0

主题

3

回帖

3

积分

童生

Rank: 2

积分
3
6
发表于 2013-5-13 16:06:13 | 只看该作者
高技术的活儿

该用户从未签到

47

主题

360

回帖

831

积分

举人

Rank: 4

积分
831
7
发表于 2013-5-13 21:27:23 | 只看该作者
编写mdx用的txt文件好办,反过来就不知道了,楼主努力!

该用户从未签到

0

主题

12

回帖

116

积分

被盗用户

积分
116
8
发表于 2013-5-15 18:13:38 | 只看该作者
mdx文件格式育supermemo的smpak格式都是一种文件包格式。
但mdx打包的方法是采用特殊算法加密了的。如果楼主有兴趣可以找一些早期没有混淆代码的android的mdx词典软件,进行逆向工程,可能可以得到文件具体格式。我只能说到这里了。
  • TA的每日心情
    擦汗
    前天 07:00
  • 签到天数: 1090 天

    [LV.10]以坛为家III

    124

    主题

    1772

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10477

    灌水大神章小蜜蜂章笑傲江湖章

    9
    发表于 2013-5-15 19:55:57 | 只看该作者
    1# linwengk

    mdx,mdx格式已经全公开,参加下面讨论:
    https://pdawiki.com/forum/viewthread.php?tid=10619

    该用户从未签到

    1

    主题

    25

    回帖

    33

    积分

    童生

    Rank: 2

    积分
    33
    10
     楼主| 发表于 2013-5-23 12:09:53 | 只看该作者
    9# spoony1971


    太感谢了!只是我用GetDict加正则解决了,绕了个道。好贴收藏备用。
  • TA的每日心情
    开心
    2020-6-12 14:43
  • 签到天数: 67 天

    [LV.6]常住居民II

    0

    主题

    291

    回帖

    2845

    积分

    解元

    Rank: 5Rank: 5

    积分
    2845

    灌水大神章

    11
    发表于 2016-8-8 14:15:32 | 只看该作者
    高技术的活儿