查看: 684|回复: 5
打印 上一主题 下一主题

[求助] 请问各位大大是如何提取别的字典的信息的?

[复制链接]

该用户从未签到

18

主题

130

回帖

1220

积分

解元

Rank: 5Rank: 5

积分
1220
跳转到指定楼层
1
发表于 2010-8-8 00:22:47 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
请问各位老大,是如何从像朗文,牛津这样的原版电子字典提取信息做mdx的?
你们是怎么解析原版字典的数据格式的?需要二进制hack的知识吗?有什么教材推荐吗?
我也是程序员,想为mdict做些贡献,又不知如何下手。
谢谢。

该用户从未签到

18

主题

130

回帖

1220

积分

解元

Rank: 5Rank: 5

积分
1220
2
 楼主| 发表于 2010-8-12 10:49:22 | 只看该作者
没有人知道吗?

该用户从未签到

15

主题

478

回帖

3314

积分

贡士

Rank: 6Rank: 6

积分
3314

灌水大神章小蜜蜂章笑傲江湖章

3
发表于 2010-8-16 20:43:28 | 只看该作者
朗文和牛津的光盘大部分可以用IDMSKconv这个脚本提取的,infolib上有介绍,你可以找一下。

该用户从未签到

131

主题

535

回帖

2826

积分

解元

Rank: 5Rank: 5

积分
2826

笑傲江湖章灌水大神章

4
发表于 2010-8-17 00:09:31 | 只看该作者
我一般是用鼠标精灵模拟复制的操作,然后写到文本中去。

该用户从未签到

53

主题

474

回帖

2635

积分

解元

Rank: 5Rank: 5

积分
2635
5
发表于 2010-8-17 21:17:37 | 只看该作者

该用户从未签到

18

主题

130

回帖

1220

积分

解元

Rank: 5Rank: 5

积分
1220
6
 楼主| 发表于 2010-8-18 11:37:46 | 只看该作者
这样啊,谢谢各位老大。
那像朗文那样内嵌的发音,是怎么提取的?