查看: 1976|回复: 5
打印 上一主题 下一主题

[求助] 如何将Kindle上的词典转成MDX?

[复制链接]

该用户从未签到

1

主题

74

回帖

286

积分

童生

Rank: 2

积分
286
跳转到指定楼层
1
发表于 2016-2-20 03:57:25 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
如题。谢谢!

该用户从未签到

46

主题

468

回帖

3743

积分

贡士

Rank: 6Rank: 6

积分
3743

灌水大神章小蜜蜂章笑傲江湖章

推荐
发表于 2016-2-21 11:02:51 | 只看该作者
可以通过 Calibre 把 mobi 转成 epub、htmlz、zip 任意一种格式,然后用 7z 等解压软件解压,会得到若干 html、imgs 等等的文件,剩下的,就容易多了,不过也要靠你们自己的技术积累了。把 HTML 与图片整合成 MDX 源文件,这个暂时没有什么一劳永逸的软件解决方法(或者我没有发现类似的方便软件)。词条基本都在那个数十兆的 HTML 里面,会编程的当然难不倒你们,不会编程的就用文本编辑器里面的正则表达式工具配合查找与替换做词典吧,论坛有很多相关教程。

难点可能是大家不知道怎么把 mobi 转成 html 而已。成功案例:

(2016-1-16)商务《新华词典》(mobi 转)
[2016.02.07]Oxförd Dictionary of Computer Science- 2016 7th Ed.

对于把多本 epub 整合成一个mdx,可以看这里:

CBETA大藏經電子佛典*epub版转mdx版*CBETA大藏经电子佛典

下载对应的 cbeta_epub_201405.zip 电子书后,使用脚本一键式处理:

BuddhistTexts.zip (1.7 KB, 下载次数: 2)

NOTE:

另外,不保证 Calibre 能转所有 mobi,能被 Calibre 转的基本表示这个 mobi 还算标准,可以转成质量不差的 epub 文件,提取的时候容易一些。如果不能被 Calibre 转,这个时候可以试试 Kindle 伴侣 这里提供的:

KindleUnpack:拆解 Kindle 电子书文件的利器

但它转出来的结构标记错乱,提取修正太麻烦,有耐心的可以试试(比如网上流传的韦氏高阶的 mobi/prc),分享你们自己折腾后的经验。

  • TA的每日心情
    开心
    2019-6-16 20:48
  • 签到天数: 221 天

    [LV.7]常住居民III

    1

    主题

    412

    回帖

    4707

    积分

    贡士

    Rank: 6Rank: 6

    积分
    4707

    笑傲江湖章灌水大神章

    2
    发表于 2016-2-21 10:06:01 | 只看该作者
    我也想知道怎么把mobi转成mdx。
  • TA的每日心情
    无聊
    昨天 23:25
  • 签到天数: 1616 天

    [LV.Master]伴坛终老

    1

    主题

    1603

    回帖

    3万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    34439

    灌水大神章

    4
    发表于 2016-2-21 13:48:31 | 只看该作者
    gnoweb 发表于 2016-2-21 11:02
    可以通过 Calibre 把 mobi 转成 epub、htmlz、zip 任意一种格式,然后用 7z 等解压软件解压,会得到若干 ht ...

    感覺好麻煩啊。

    该用户从未签到

    0

    主题

    44

    回帖

    139

    积分

    童生

    Rank: 2

    积分
    139
    5
    发表于 2016-2-21 21:42:58 | 只看该作者
    技术性很强。

    该用户从未签到

    1

    主题

    74

    回帖

    286

    积分

    童生

    Rank: 2

    积分
    286
    6
     楼主| 发表于 2016-2-22 04:40:48 | 只看该作者
    gnoweb 发表于 2016-2-21 11:02
    可以通过 Calibre 把 mobi 转成 epub、htmlz、zip 任意一种格式,然后用 7z 等解压软件解压,会得到若干 ht ...

    看着可行。谢谢!