查看: 1136|回复: 6
打印 上一主题 下一主题

[求助] 请教:把mdict的源文件转成excel的方法

[复制链接]

该用户从未签到

5

主题

485

回帖

2385

积分

解元

Rank: 5Rank: 5

积分
2385

灌水大神章小蜜蜂章笑傲江湖章

跳转到指定楼层
1
发表于 2014-7-12 07:56:22 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 ok927 于 2014-7-12 12:34 编辑

请教:把mdict的源文件转成excel,要求一个词条一行,词条、释义、分隔符</>各占一列,该怎么操作呢?
谢谢大家。
  • TA的每日心情
    擦汗
    前天 07:00
  • 签到天数: 1090 天

    [LV.10]以坛为家III

    124

    主题

    1772

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10477

    灌水大神章小蜜蜂章笑傲江湖章

    2
    发表于 2014-7-12 13:15:22 | 只看该作者
    恐怕很少有人会写代码转成微软的专用格式,实在想要的话就自己写个VB程序吧。

    该用户从未签到

    20

    主题

    222

    回帖

    4029

    积分

    贡士

    Rank: 6Rank: 6

    积分
    4029

    灌水大神章小蜜蜂章笑傲江湖章

    3
    发表于 2014-7-12 14:58:55 | 只看该作者
    你能把文本整理到
    headword\tcontent\t</>
    headword\tcontent\t</>
    headword\tcontent\t</>
    .
    .
    .

    就能直接貼到 Excel

    不過 Excel 一個儲存格只能放三萬多個字元

    该用户从未签到

    5

    主题

    485

    回帖

    2385

    积分

    解元

    Rank: 5Rank: 5

    积分
    2385

    灌水大神章小蜜蜂章笑傲江湖章

    4
     楼主| 发表于 2014-7-12 16:23:09 | 只看该作者
    好的。谢谢您。

    该用户从未签到

    5

    主题

    485

    回帖

    2385

    积分

    解元

    Rank: 5Rank: 5

    积分
    2385

    灌水大神章小蜜蜂章笑傲江湖章

    5
     楼主| 发表于 2014-7-13 11:30:45 | 只看该作者
    把mdict的源文件转成excel,要求一个词条一行,词条、释义、分隔符</>各占一列,该怎么操作呢?

    查\n</>\n
    替\n

    查^(?<sub>.*?)\n
    替\1\t

    查\n
    替\t\n</>
  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

    11

    主题

    137

    回帖

    1927

    积分

    解元

    Rank: 5Rank: 5

    积分
    1927
    6
    发表于 2014-8-2 09:09:54 | 只看该作者
    </>也占一列有何意义? 例如:

    week        <font color=red>week</font><br><font color=green>指的是一星期7天,每天24小时,一般表示提供不间断的服务也表示为7*24或7/24</font><br><font color=green></font><br><font color=green></font>

    是要变成如下的xls格式吗:

    col0         col1
    week       指的是一星期7天,每天24小时,一般表示提供不间断的服务也表示为7*24或7/24

    还是:

    col0        
    week      

    col1
    <font color=red>week</font><br><font color=green>指的是一星期7天,每天24小时,一般表示提供不间断的服务也表示为7*24或7/24</font><br><font color=green></font><br><font color=green></font>

    点评

    </>是mdict源文件的词条释义结束时的分例隔符(个人理解)呀。因为转换之后,还要转回mdict的源文件的。 转成excel,只是方便编辑内容而己。  发表于 2014-8-2 09:25
  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

    11

    主题

    137

    回帖

    1927

    积分

    解元

    Rank: 5Rank: 5

    积分
    1927
    7
    发表于 2014-8-2 09:10:39 | 只看该作者
    本帖最后由 lixun305 于 2014-8-2 09:15 编辑
    spoony1971 发表于 2014-7-12 13:15
    恐怕很少有人会写代码转成微软的专用格式,实在想要的话就自己写个VB程序吧。


    确实编过,查找 mdb, xls, dict sqlite格式的词典文件。 可惜 mdx 文件格式不公开,goldendict的源码咱也看的头大,搞不定,所以只能支持getdict转换之后的 mdx 文本格式的文件,很别扭。