查看: 1806|回复: 10
打印 上一主题 下一主题

[求助] [错误] mdxbuilder总是提示:Content is longer then 8388608 at position:...

[复制链接]
  • TA的每日心情
    郁闷
    2019-9-21 08:52
  • 签到天数: 250 天

    [LV.8]以坛为家I

    33

    主题

    706

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15430
    跳转到指定楼层
    1
    发表于 2018-11-8 15:35:04 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
    今天尝试排版汉典,结果打包的时候总是提示错误。

    即使是 MdxExport.exe导出的原始txt文件-不修改,仍然提示这个错误,使用的大文件的mdxbuilder版本也是不行。看到这个帖子中提示的类似的错误,但是txt文件中并没有类似的格式错误。。。


    有没有遇到的呢?


    Begining loading source file...
    Content is longer then 8388608 at position: 0 of the source file
    Failed to load source file, process cancelled
    如下图:



  • TA的每日心情
    奋斗
    2018-11-10 00:38
  • 签到天数: 346 天

    [LV.8]以坛为家I

    0

    主题

    975

    回帖

    3090

    积分

    禁止发言

    积分
    3090

    灌水大神章

    2
    发表于 2018-11-8 15:42:51 | 只看该作者
    如果不是源文件格式错误的话,尝试着用低版本的mdxbuilder,最新的好像方方面面的自成一套.原有的拆包打包的都是基于旧版本的mdxbilder
  • TA的每日心情
    慵懒
    2023-1-18 13:13
  • 签到天数: 539 天

    [LV.9]以坛为家II

    14

    主题

    1495

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    17223

    灌水大神章QQ 章

    3
    发表于 2018-11-8 15:43:13 | 只看该作者
    lgmcw有完美的python生成mdx脚本,你找找看他
  • TA的每日心情
    开心
    2019-3-26 21:36
  • 签到天数: 178 天

    [LV.7]常住居民III

    16

    主题

    549

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    26462

    QQ 章

    4
    发表于 2018-11-8 16:11:50 | 只看该作者
    本帖最后由 流星冲击 于 2018-11-8 16:57 编辑

    提供测试方案:
    提取:用MdxExport3.5或者python版readMdict生成txt。
    写入前:复制原始txt的全文内容到一个新建的空白文件再另存为,最后才写入。这一步是确保编码没问题。
    写入:词条自动排序用mdxbuilder 3.0 beta2,词条自定义排序用python版writeMdict。
  • TA的每日心情
    郁闷
    2019-9-21 08:52
  • 签到天数: 250 天

    [LV.8]以坛为家I

    33

    主题

    706

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15430
    5
     楼主| 发表于 2018-11-8 16:18:27 | 只看该作者
    greatszh 发表于 2018-11-8 15:42
    如果不是源文件格式错误的话,尝试着用低版本的mdxbuilder,最新的好像方方面面的自成一套.原有的拆包打包的 ...

    尝试了2.1  3.0(含大文件版本)  4.0  版本,都是出错。。。

  • TA的每日心情
    郁闷
    2019-9-21 08:52
  • 签到天数: 250 天

    [LV.8]以坛为家I

    33

    主题

    706

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15430
    6
     楼主| 发表于 2018-11-8 16:44:59 | 只看该作者
    流星冲击 发表于 2018-11-8 16:11
    提供测试方案:
    提取:用MdxExport3.5或者python版readMdict生成txt。
    写入前:复制原始txt的全文内容到一个新 ...

    厉害,使用MdxExport3.5 打开mdx文件时,就发现问题了。——mdx竟然时用UTF-16压缩的。——平时使用mdxbuilder都是默认选择utf-8。
    ----------------------
    另存txt文件为utf-8   ---  搞定!!!
    -----------
    谢谢
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    7
    发表于 2018-11-9 01:11:12 | 只看该作者
    流星冲击 发表于 2018-11-8 16:11
    提供测试方案:
    提取:用MdxExport3.5或者python版readMdict生成txt。
    写入前:复制原始txt的全文内容到一个新 ...

    謝謝流星 兄 總是能及時的指點迷津排憂解難
  • TA的每日心情
    奋斗
    2020-6-15 09:00
  • 签到天数: 34 天

    [LV.5]常住居民I

    17

    主题

    261

    回帖

    5253

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    5253
    8
    发表于 2019-9-19 20:27:04 | 只看该作者
    Content is longer then 8388608 at position: 0 of the source file。
    我也出现了这个问题,兄弟,你是怎么解决的。
  • TA的每日心情
    无聊
    昨天 07:14
  • 签到天数: 1152 天

    [LV.10]以坛为家III

    160

    主题

    1918

    回帖

    8万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    89459

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    9
    发表于 2020-6-9 14:33:25 | 只看该作者
    删除空格
    Emeditor:

    •Default Menu: Edit > Convert Selection > Remove Empty Lines
  • TA的每日心情
    郁闷
    2022-11-17 14:05
  • 签到天数: 58 天

    [LV.5]常住居民I

    1

    主题

    81

    回帖

    2067

    积分

    解元

    Rank: 5Rank: 5

    积分
    2067
    10
    发表于 2021-4-6 21:52:41 | 只看该作者
    我今天也碰到这个问题了,原因是词条内容行太长,最长的词条内容行有190万字节长,后来把词条内容行长缩到40多万字节以下就可以转了

    该用户从未签到

    0

    主题

    10

    回帖

    86

    积分

    白身

    Rank: 1

    积分
    86
    11
    发表于 2022-8-28 17:05:30 | 只看该作者
    wyzh97 发表于 2018-11-8 16:44
    厉害,使用MdxExport3.5 打开mdx文件时,就发现问题了。——mdx竟然时用UTF-16压缩的。——平时使用mdxbu ...

    我也遇到到了这个问题,虽然你的问题和我的不一样,但还是受到了启发,多谢!我出这个问题是因为文件不是Windows CR LF换行,不知道为什么存成了Unix形式的换行