查看: 768|回复: 10
打印 上一主题 下一主题

[求助] 维基百科的转换比是多少?

[复制链接]

该用户从未签到

53

主题

474

回帖

2635

积分

解元

Rank: 5Rank: 5

积分
2635
跳转到指定楼层
1
发表于 2008-12-6 16:20:44 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
我想转法语维基百科,xml文件有4.15G,我想知道转换成的TXT文件有多大?因为我正在转,用的是wikitomdic 2.0,已经用了2个小时刚刚转了将近2G,如果文件太大,我今天就不转算了。电脑配置是T2390/2G。
  • TA的每日心情
    开心
    2018-7-19 02:16
  • 签到天数: 20 天

    [LV.4]偶尔看看III

    213

    主题

    1686

    回帖

    2万

    积分

    管理员

    Rank: 13Rank: 13Rank: 13Rank: 13

    积分
    28047

    灌水大神章小蜜蜂章笑傲江湖章管理组专用章

    2
    发表于 2008-12-6 20:36:41 | 只看该作者
    比xml稍微少一些。

    该用户从未签到

    53

    主题

    474

    回帖

    2635

    积分

    解元

    Rank: 5Rank: 5

    积分
    2635
    3
     楼主| 发表于 2008-12-7 16:12:22 | 只看该作者
    TXT是转换好了,不过在用MDXBUILD编译的时候出错,于是尝试用UE打开修复,那不是一般的慢啊,3.53G的文件用了20分钟才可以完全打开,而且还在C盘生成了7G多的临时文件。一Ctrl+H又是20分钟,Ctrl+G完了后再一次Ctrl+H又是20分钟,结果看了半天也没发现哪有问题,真是疯了!如果改正一个错都要1个小时的话,那不知道要到何年何月啊!

    有没有什么简单一点的办法?或者有没有什么更好的软件?

    把TXT文件先分割成几个小文件然后修改好了之后再合并行得通吗?

    该用户从未签到

    53

    主题

    474

    回帖

    2635

    积分

    解元

    Rank: 5Rank: 5

    积分
    2635
    4
     楼主| 发表于 2008-12-7 16:47:41 | 只看该作者
    有没有做过英文维基百科的指点一下啊,这么大个文件怎么处理?
  • TA的每日心情
    开心
    2018-7-19 02:16
  • 签到天数: 20 天

    [LV.4]偶尔看看III

    213

    主题

    1686

    回帖

    2万

    积分

    管理员

    Rank: 13Rank: 13Rank: 13Rank: 13

    积分
    28047

    灌水大神章小蜜蜂章笑傲江湖章管理组专用章

    5
    发表于 2008-12-7 20:02:36 | 只看该作者
    我也没做过太大的。
    我想这么大的文件应该是用tomeraider来读了。
    http://infodisiac.com/Wikipedia/TomeRaider/Download/2007/WP_FR_(P)PC_TXT.tr3
    这个是07年的
    tomeraider的下载在其他版里。
    https://pdawiki.com/forum/thread-916-1-1.html

    [ 本帖最后由 发哥 于 2008-12-7 20:07 编辑 ]

    该用户从未签到

    53

    主题

    474

    回帖

    2635

    积分

    解元

    Rank: 5Rank: 5

    积分
    2635
    6
     楼主| 发表于 2008-12-7 20:27:50 | 只看该作者
    tomeraider的体积这么巨大啊。

    不过我现在用winhex把TXT分为了36个文件,每个文件100M,现在已经完成了3个文件的修改,估计修改到第36个还是有可能的,愚公移山啊!

    该用户从未签到

    45

    主题

    1420

    回帖

    1万

    积分

    管理员

    Rank: 13Rank: 13Rank: 13Rank: 13

    积分
    10971

    管理组专用章

    7
    发表于 2008-12-7 21:58:57 | 只看该作者
    原帖由 zcm1019 于 2008-12-7 16:12 发表
    TXT是转换好了,不过在用MDXBUILD编译的时候出错,于是尝试用UE打开修复,那不是一般的慢啊,3.53G的文件用了20分钟才可以完全打开,而且还在C盘生成了7G多的临时文件。一Ctrl+H又是20分钟,Ctrl+G完了后再一次Ctrl+ ...


    Ultraedit 可以设置不用生成临时文件的。用最新版的ultraedit貌似打开也快一点。
    另外分开处理后合并是可以的。不过要注意文件末尾的换行符。

    该用户从未签到

    53

    主题

    474

    回帖

    2635

    积分

    解元

    Rank: 5Rank: 5

    积分
    2635
    8
     楼主| 发表于 2008-12-7 23:13:42 | 只看该作者
    终于转换好了!太高兴了。最后mdx文件大小是0.98G。不过有个别词条没有解释,不知何故。
    B205FB 该用户已被删除
    9
    发表于 2008-12-8 01:52:28 | 只看该作者
    同志啊,法语维基百科在网上有下的啊

    该用户从未签到

    53

    主题

    474

    回帖

    2635

    积分

    解元

    Rank: 5Rank: 5

    积分
    2635
    10
     楼主| 发表于 2008-12-8 14:52:47 | 只看该作者
    什么地方有下的啊?

    这个是081201的数据库。

    该用户从未签到

    1

    主题

    15

    回帖

    1

    积分

    童生

    Rank: 2

    积分
    1
    11
    发表于 2008-12-9 20:03:36 | 只看该作者
    有英日法俄葡波意的吧,没有西语的,上次作了一个成功了,但不知道怎么做成精简版本的,700M太大了。。。