查看: 1670|回复: 3
打印 上一主题 下一主题

[工具] 制作维基词库时将XML文件转为TXT文件的两个软件

[复制链接]

该用户从未签到

375

主题

1098

回帖

7191

积分

会元

Rank: 7Rank: 7Rank: 7

积分
7191

小蜜蜂章笑傲江湖章灌水大神章

跳转到指定楼层
1
发表于 2012-2-8 20:47:40 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
应部分坛友需要上传制作维基词库时将XML文件转为TXT文件的两个软件:

http://115.com/file/dpq8oql6#
WikiToMDict2.0.exe

http://115.com/file/c29109je#
Wiki2TXTv2.1.exe

使用软件时,将下载的维基资源文件放在软件同一目录下(文件夹内)并改名为pages-articles.xml,然后在CMD下输入软件名运行程序,得到相应的txt文件。“2.0“得出的文件名都是wiki.txt”。

该用户从未签到

3

主题

44

回帖

352

积分

被盗用户

积分
352
2
发表于 2012-2-8 23:43:42 | 只看该作者
本帖最后由 bltian 于 2012-2-8 23:53 编辑

非常感谢!!!

有个问题: 本人非常喜欢wiki词典,也下载了本论坛里的wiki词典(英文和中文),但是,部分词条的解释包含了很多的语种,例如:German,French, ...., 多的有100-200个语种,每个语种至少占一行,占用大量的空间,而我们又不需要,我们只要英文-英文/中文,或者中文-中文/英文。

所以,在wiki2txt的程序里,能否去除这部分内容。这个问题仅限于wiki词典(英文和中文)。

再一次感谢 !!

该用户从未签到

0

主题

52

回帖

133

积分

禁止发言

积分
133
4
发表于 2020-2-3 15:01:35 | 只看该作者
Thanks for your great work.