查看: 465|回复: 5
打印 上一主题 下一主题

[求助] 请教词条提取中遇到的一个问题

[复制链接]
  • TA的每日心情
    开心
    2023-2-17 08:38
  • 签到天数: 321 天

    [LV.8]以坛为家I

    4

    主题

    785

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11494

    QQ 章

    跳转到指定楼层
    1
    发表于 2019-8-2 00:31:42 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    我利用Source Editor对coca 60000的mdx进行提取词条操作后,用MdxBuilder将提取出的txt重新打包成mdx,发现在txt里面处于第一个的词条a,在mdx里面总是成为了最后一个,其他mdx进行提取——打包操作同样如此。但是如果不进行提取操作,只对mdx进行解压——打包操作,则不会出现此问题。可是我又看不出提取出的txt到底哪里出了问题,因此望各位加以指点。
  • TA的每日心情
    开心
    2019-6-27 08:03
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    40

    主题

    464

    回帖

    5430

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    5430

    灌水大神章

    2
    发表于 2019-8-2 07:21:00 | 只看该作者
    我以前也遇见过同样问题 忘记当时是怎么真正解决的了 但有一个当时用过的拙笨的解决办法还记得 就是把txt最后一个词条文本 剪切再粘贴到最前边 然后打包MDX文件即可

    评分

    1

    查看全部评分

  • TA的每日心情
    开心
    2023-2-17 08:38
  • 签到天数: 321 天

    [LV.8]以坛为家I

    4

    主题

    785

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11494

    QQ 章

    3
     楼主| 发表于 2019-8-2 07:57:28 | 只看该作者
    menglongma 发表于 2019-8-2 07:21
    我以前也遇见过同样问题 忘记当时是怎么真正解决的了 但有一个当时用过的拙笨的解决办法还记得 就是把txt最 ...

    你的方法应该可行,我把第一个单词删除后,第二个单词就到了最后面。不过实在想不明白提取这个过程到底出了什么问题。

    该用户从未签到

    539

    主题

    3046

    回帖

    25万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    251476

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    4
    发表于 2019-8-2 08:57:10 | 只看该作者
    文件要保存成utf-8无bom
  • TA的每日心情
    开心
    2023-2-17 08:38
  • 签到天数: 321 天

    [LV.8]以坛为家I

    4

    主题

    785

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11494

    QQ 章

    5
     楼主| 发表于 2019-8-2 09:09:38 | 只看该作者
    klwo2 发表于 2019-8-2 08:57
    文件要保存成utf-8无bom

    可是从source editor导出txt时,没法对txt格式进行设置啊。
  • TA的每日心情
    开心
    2023-2-17 08:38
  • 签到天数: 321 天

    [LV.8]以坛为家I

    4

    主题

    785

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11494

    QQ 章

    6
     楼主| 发表于 2019-8-2 12:54:02 | 只看该作者
    klwo2 发表于 2019-8-2 08:57
    文件要保存成utf-8无bom

    懂了,已经解决。非常感谢。