查看: 470|回复: 10
打印 上一主题 下一主题

[求助] 請教快速容易的方法轉PDF to mdx

[复制链接]
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    跳转到指定楼层
    1
    发表于 2015-12-28 15:26:35 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 喬治兄 于 2015-12-28 15:29 编辑

    昨晚看了一些前輩的方法
    step 1. PDF to html
    step 2. html to source txt
                   a.問題是對html和正則語法不是很會
             b.有看到有人驗證markdown來簡化html語法符號
             c.問題是markdown簡化html語法符號,但似乎更難判斷和編輯成source txt, 簡化html語法符號後似乎特徵更少更難判斷
                  d.請問是否有更佳簡化之方法用markdown or other tools ?
                  e. Would you please provide some "markdown edit the html examples" to illustrate these steps?
    step 3.txt to mdx     

    Thank you and good luck     

       

    2015-12-24_215844.png (7.75 KB, 下载次数: 0)

    2015-12-24_215844.png
  • TA的每日心情
    开心
    2021-4-30 05:36
  • 签到天数: 1 天

    [LV.1]初来乍到

    27

    主题

    1336

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    13273

    笑傲江湖章灌水大神章

    推荐
    发表于 2015-12-28 20:14:58 | 只看该作者
    Oeasy 大,我转了一个pdf到ePub格式, The Cambridge Guide to English - PAM PETERS.part1.rar (1 MB, 下载次数: 8) The Cambridge Guide to English - PAM PETERS.part2.rar (998 KB, 下载次数: 8) 您看从这个格式再到mdx是否简单一些,谢谢

    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    2
    发表于 2015-12-28 17:46:43 | 只看该作者


    我以一个制作过上百个 mdx 的过来人说一句。
    PDF 哪怕是文字版的 PDF ,想转完美的 mdx ,想“快速、容易”,基本是不可能的。
    还不如人工一条条录入或者复制粘贴。


  • TA的每日心情
    开心
    2021-4-30 05:36
  • 签到天数: 1 天

    [LV.1]初来乍到

    27

    主题

    1336

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    13273

    笑傲江湖章灌水大神章

    3
    发表于 2015-12-28 18:55:36 | 只看该作者
    Oeasy 发表于 2015-12-28 17:46
    我以一个制作过上百个 mdx 的过来人说一句。
    PDF 哪怕是文字版的 PDF ,想转完美的 mdx ,想“快速、 ...

    Oeasy 大,有软件可以把文字版pdf转成mobi或者epub格式,这样再转成mdx是不是简单一些
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    4
     楼主| 发表于 2015-12-28 19:03:07 | 只看该作者
    本帖最后由 喬治兄 于 2015-12-28 20:06 编辑
    Oeasy 发表于 2015-12-28 17:46
    我以一个制作过上百个 mdx 的过来人说一句。
    PDF 哪怕是文字版的 PDF ,想转完美的 mdx ,想“快速、 ...


    Oeasy 版大你好
             這些日子裏來,小弟每每閱讀您的文章後總有許多想法啟發和莫名的動力觸發自己去完成自己想要的字典,無奈對獲得Source txt 前的過程產物html語法符號正則語法實在難以下嚥,且這非一日之功能所及.
             小弟目前想到的作法:
    • 1 copy pdf txt to word docx, maintain the word font
    • 2 then copy word docx to excel, still keep the word font
    • 3 use excel vba to screen the Bold font or other specical features in txt then place a symbols  "⊕,◎,○,⊙" before these features.
    • 4 then use ultraedit to organize the txt with these symbols  "⊕,◎,○,⊙"

           excel vba 現請以前的同事幫忙寫的

           此方法處理pdf是否很笨,Oeasy兄能否再給小弟一些建議

    2015-12-24_214937.png (21.59 KB, 下载次数: 0)

    2015-12-24_214937.png
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    6
     楼主| 发表于 2015-12-28 20:26:40 | 只看该作者
    经典与古典 发表于 2015-12-28 20:14
    Oeasy 大,我转了一个pdf到ePub格式,您看从这个格式再到mdx是否简单一些,谢谢

    小弟也研究看看

    2015-12-24_215932.png (6.97 KB, 下载次数: 0)

    2015-12-24_215932.png

    2015-12-24_215005.png (19.75 KB, 下载次数: 0)

    2015-12-24_215005.png
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    7
     楼主| 发表于 2015-12-28 20:40:31 | 只看该作者
    本帖最后由 喬治兄 于 2015-12-28 20:52 编辑
    经典与古典 发表于 2015-12-28 20:14
    Oeasy 大,我转了一个pdf到ePub格式,您看从这个格式再到mdx是否简单一些,谢谢


    應該是有錯誤的

    錯誤應該是在於PDF上你看不到OCR的順序
    當你轉成epub or mobi 則當時OCR的順序就會顯示出來
    除非OCR的順序是按照閱讀的順序轉成epub or mobi 應該就會是正確的

    2015-12-28_202815.png (94.06 KB, 下载次数: 0)

    2015-12-28_202815.png

    2015-12-28_203355.png (86.95 KB, 下载次数: 0)

    2015-12-28_203355.png

    2015-12-24_215005.png (19.75 KB, 下载次数: 0)

    2015-12-24_215005.png
  • TA的每日心情
    开心
    2019-6-16 20:48
  • 签到天数: 221 天

    [LV.7]常住居民III

    1

    主题

    412

    回帖

    4707

    积分

    贡士

    Rank: 6Rank: 6

    积分
    4707

    笑傲江湖章灌水大神章

    8
    发表于 2015-12-30 18:33:58 | 只看该作者
    有些pdf拷贝不了文本呀,真很难办。
  • TA的每日心情
    慵懒
    2023-2-4 11:26
  • 签到天数: 579 天

    [LV.9]以坛为家II

    12

    主题

    1027

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    12103

    灌水大神章

    9
    发表于 2016-1-20 23:52:34 | 只看该作者
    Oeasy 发表于 2015-12-28 17:46
    我以一个制作过上百个 mdx 的过来人说一句。
    PDF 哪怕是文字版的 PDF ,想转完美的 mdx ,想“快速、 ...

    O大,有没有把图片扫描版的PDF转成mdd的方法啊?

    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    10
    发表于 2016-1-22 14:20:09 | 只看该作者
    865052004 发表于 2016-1-20 23:52
    O大,有没有把图片扫描版的PDF转成mdd的方法啊?


    可以参考这个帖子by tsiank 图像版mdict字典制作方法 https://www.pdawiki.com/forum/fo ... hread&tid=13451


    该用户从未签到

    5

    主题

    95

    回帖

    258

    积分

    童生

    Rank: 2

    积分
    258
    11
    发表于 2016-3-7 11:28:45 | 只看该作者
    文字版的PDF可以用word2013或者2016完美打开,之后再转txt,再转mdx是不是更加简单点啊???