查看: 831|回复: 5
打印 上一主题 下一主题

[求助] 求助:使用chm反编译工具和html转txt工具,并不能生成需要的txt,问题出在哪里?

[复制链接]
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    104

    主题

    1687

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    16432

    小蜜蜂章笑傲江湖章灌水大神章

    跳转到指定楼层
    1
    发表于 2009-3-6 10:50:45 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    使用用CHM反编译工具反编译chm文件后,发现生成的不是一个文件,而是每一个词条都是一个单独文件,是不是在用Html转Txt工具之前必须先把反编译产生的html文件合并?我没有合并使用了Html转Txt工具,却无法生成所需要的txt文件。大家帮忙看看,问题出在哪里?总不能老求助吧,也想从最简单的学起自己做词典,大家多指点指点:handshake


    转换后的text里边有很多乱七八糟的符号和文字,现在传上来,帮忙帮忙看看!



    [ 本帖最后由 louislaolu 于 2009-3-6 17:42 编辑 ]

    coverted.rar

    90.92 KB, 下载次数: 16, 下载积分: 米 -5 粒

  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    29

    主题

    553

    回帖

    5307

    积分

    版主

    Rank: 10Rank: 10Rank: 10

    积分
    5307

    灌水大神章小蜜蜂章笑傲江湖章管理组专用章

    2
    发表于 2009-3-6 10:55:01 | 只看该作者
    开始—运行 输入cmd
    再输入 hh -decompile X:\A Y:\B.chm
    其中 X:\A是反编译后储存文件的路径, Y:\B.chm是CHM文件的路径。

    这只是恢复原样
    需要重新编辑合并
    方法:htm--转换为txt--编辑每个txt--合并为所需的maxbuilder文件---转化为mdx

    [ 本帖最后由 ldlcau 于 2009-3-6 10:57 编辑 ]
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    104

    主题

    1687

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    16432

    小蜜蜂章笑傲江湖章灌水大神章

    3
     楼主| 发表于 2009-3-6 17:19:25 | 只看该作者
    本人愚钝,不是很清楚。恢复原样?恢复成什么样子?怎么编辑?
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    104

    主题

    1687

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    16432

    小蜜蜂章笑傲江湖章灌水大神章

    4
     楼主| 发表于 2009-3-6 17:41:22 | 只看该作者
    转换后的text里边有很多乱七八糟的符号和文字,现在传上来,帮忙帮忙看看!
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    29

    主题

    553

    回帖

    5307

    积分

    版主

    Rank: 10Rank: 10Rank: 10

    积分
    5307

    灌水大神章小蜜蜂章笑傲江湖章管理组专用章

    5
    发表于 2009-3-8 11:06:03 | 只看该作者
    你给的是htm的源文件
    反编译CHM文件得到的是htm文件
    你用我的方法转下
    htm文件用TextForever转换为txt文件

    该用户从未签到

    45

    主题

    1420

    回帖

    1万

    积分

    管理员

    Rank: 13Rank: 13Rank: 13Rank: 13

    积分
    10971

    管理组专用章

    6
    发表于 2009-3-8 11:12:08 | 只看该作者
    如果html的内容合适,其实可以不用转成txt, 直接用html好了。不过需要注意的是变成mdxbuilder用的txt时,html里的内容只能保留<body> </body> 之内的内容, 其他的附加部分需要删除掉(body 那个标记也要去掉)