查看: 1303|回复: 14
打印 上一主题 下一主题

[教程] 外研社新英漢詞典 (圖片版) 的製作步驟

[复制链接]
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    跳转到指定楼层
    1
    发表于 2019-3-17 21:05:27 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 喬治兄 于 2019-3-21 13:37 编辑

    小弟並無什編程和正則表達式和 html css 等等背景知識
    純就對 excel 有些經驗試著製作, 也就土法煉鋼之法
    正則表達式和 html css 均是套用
    若教程有疏失敬請海涵也請不吝指出錯誤
    外研社新英漢詞典 (圖片版) 的製作步驟如下:
    1. 要先預估其要製作的辭典的辭彙量,
        若能知道正確辭彙量是最好的, 但往往不知道其多少辭彙量
        可能辭典序言上標示的辭彙量也不一定正確
        此可利用 Excel 統計 random 的函數產生的 30 個隨機數來挑其頁數
        算一下那 30 頁 每頁各多少詞頭, 然後求個平均值在乘上頁數.......就大概是那辭彙量
        保險一點的話在加上3個標準異差乘上頁數.......這樣辭彙量應能大概都能含概了吧
        因此關於您要用多少的辭彙量來配那本字典, 您也可選 30~40 萬的 wordlist 來配4~5 萬的辭典
        問題是整頁都是多一堆辭典沒有的字, 也是同樣多花時間找
        p.s. 辭典詞彙量估算匹配 https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33621&extra=
        已提供試算表 您可自行預估拿捏
    2. 對每頁取其左上角詞頭 OCR後再轉貼到 excel , 第1欄為單字, 第2欄為頁數, 如圖No.1
    3. 如圖 No.2 第1欄是正常的單字, 第2欄 是處理過的單字==>去各種 ' ,  . -  和空格 全去掉僅留英文字元
       其原因請參考此帖[讨论] 索引字典詞頭的排列順序
        https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=32609&extra=
       然後選其4欄對第2欄排序若第3欄的順序有錯則表示是您第2欄的單字處理的還有問題
       此步驟一定要處理到依第2欄排序,但第3欄的頁數順序是無誤的
       您可排序後自增一欄用後面頁數減前面頁數來看是否是 1 然後查找不是 1 直到
       依第2欄排序,但第3欄的頁數順序是無誤的為止
    4. 然後選其 2, 3, 4 欄 整個 1~1795列 有資料的區塊在 excel 公式 \ 名稱管理員 ==> 新增一個名稱
        參考 圖 No.3 , 圖 No.4 如page 的那個名稱
    5. 參考圖 No.5 把您要搭配的 wordlist 考到 另一 sheet 的 A 欄 單字 那欄
        B 欄 搭配用則是 A 欄處理過的單字 處理的方法==>去各種 ' ,  . -  和空格 全去掉僅留英文字元
        然後再選取 A , B 兩欄依 B 欄為準作排序
    6. 然後就可在 C, D 兩欄輸入vlookup 的公式了  C 欄=>參考圖 No.6
       D 欄=>參考圖 No.7
    7. 參考圖 No.8
    8. 參考圖 No.9 但因 concatenate 此函數無法輸入" 符號 , 所以考背好整欄後在文字處理器去加工 " 符號好後再
        回貼到此欄
    9. 把 E,F 兩欄資料複製到文字處理器作正則處理把同一頁的單字拉到同一列上 如圖 No.10
        ^p<tab>==> ,
    10. 再回貼到 excel 另一 sheet 上 如圖 No.11 變成 A , B 兩欄的資料
    11. 再以 圖 No.11  A , B 兩欄的資料再新增一個名稱 pw 如圖 No.12
         公式 \ 名稱管理員 ==> 新增一個名稱
         如此掛在每頁的單詞表已完成剩下僅是在合併翻頁和圖檔.png的合併
    12. 單詞表合併翻頁和圖檔.png 不太好解釋但做起來不難就純粹以 CONCATENATE 函數去把所有想要實現的功能結合掛在頁數的那個編碼號而已
          如圖 No.13 ====>結合後的結果(翻頁+單詞表+圖檔.png)在 C 欄
    13. 然後再以圖 No.13 的 B , C 兩欄
         公式 \ 名稱管理員 ==> 新增一個名稱 wtp
         如圖 No.14
    14. 再把前面 wordlist 配好頁數的部分考到另一空白 sheet 上 然後刪到剩下單詞和頁數兩欄 No.15 ==>No.16
    15. 如圖 No.17 以頁數的那個編碼號為 lookup value 去拉出 wtp 的那張表對映到每個單字
    16. 再把圖 No.17 的 A, C 兩欄考到 文字處理器 上加工正則 highlight 的那部份 圖 No.18, 圖 No.19
    17. 最後在執行可以讓單詞表內和詞條相同的那個單字 highlight 的正則替代式 圖 No.20
         或參考此帖
    8樓  jeanleem6  的正則替代式把 ①改為<mark>  ,   ②改為</mark>
         https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33536&extra=

         此條 正則替代式 請在 Emeditor 上執行 UltraEdit 執行不了 .........原因不明
    18. 上傳容量今日已滿明日再補 excel 檔了 檔案15m 共4個............剛傳又滿上傳上限了

    19. [工具] (更新)图片版mdx源文件生成工具
         tsiank 兄 已提供完美秒殺生成工具, https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33574&extra=&page=1 讚! 讚! 讚!

         


    2019-03-17_215510.png (4.95 KB, 下载次数: 0)

    No.1

    No.1

    2019-03-17_220643.png (9.35 KB, 下载次数: 0)

    NO.2

    NO.2

    2019-03-17_223928.png (11.51 KB, 下载次数: 0)

    NO.3

    NO.3

    2019-03-17_223945.png (7.51 KB, 下载次数: 0)

    NO.4

    NO.4

    2019-03-17_230509.png (17.05 KB, 下载次数: 0)

    NO.5

    NO.5

    2019-03-17_232419.png (20.98 KB, 下载次数: 0)

    NO. 6

    NO. 6

    2019-03-17_233006.png (20.54 KB, 下载次数: 0)

    No.7

    No.7

    2019-03-17_233804.png (17.38 KB, 下载次数: 0)

    2019-03-17_233804.png

    2019-03-17_234505.png (18.74 KB, 下载次数: 0)

    No.9

    No.9

    2019-03-18_000044.png (18.87 KB, 下载次数: 0)

    No.10

    No.10

    2019-03-18_000714.png (21.15 KB, 下载次数: 0)

    No.11

    No.11

    2019-03-18_002138.png (21.07 KB, 下载次数: 0)

    No.12

    No.12

    2019-03-18_004154.png (14.5 KB, 下载次数: 0)

    No.13

    No.13

    2019-03-18_005122.png (27.42 KB, 下载次数: 0)

    No.14

    No.14

    2019-03-18_010005.png (8.61 KB, 下载次数: 0)

    No.15

    No.15

    2019-03-18_010543.png (3.73 KB, 下载次数: 0)

    No.16

    No.16

    2019-03-18_011116.png (19.15 KB, 下载次数: 0)

    No.17

    No.17

    2019-03-18_012954.png (21.37 KB, 下载次数: 0)

    No.18

    No.18

    2019-03-18_013307.png (31.33 KB, 下载次数: 0)

    2019-03-18_013307.png

    2019-03-18_014115.png (31.96 KB, 下载次数: 0)

    No.20

    No.20

    外研社新英漢詞典_2.7z.001.zip

    4 MB, 下载次数: 41, 下载积分: 米 -5 粒

    外研社新英漢詞典_2.7z.002.zip

    4 MB, 下载次数: 17, 下载积分: 米 -5 粒

    外研社新英漢詞典_2.7z.003.zip

    4 MB, 下载次数: 25, 下载积分: 米 -5 粒

    外研社新英漢詞典_2.7z.004.zip

    3.09 MB, 下载次数: 20, 下载积分: 米 -5 粒

    评分

    2

    查看全部评分

    本帖被以下淘专辑推荐:

  • TA的每日心情
    开心
    2020-11-10 14:17
  • 签到天数: 580 天

    [LV.9]以坛为家II

    0

    主题

    1077

    回帖

    9806

    积分

    禁止发言

    积分
    9806
    2
    发表于 2019-3-17 23:41:45 | 只看该作者
    vlookup可以详细解释下那四行分别是什么意思吗?谢谢了这个教程很详细
  • TA的每日心情
    无聊
    2022-9-25 21:09
  • 签到天数: 1136 天

    [LV.10]以坛为家III

    17

    主题

    3142

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    25289

    灌水大神章

    3
    发表于 2019-3-18 07:13:29 | 只看该作者
    “虽不中亦不远矣”的思路很有创见。
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    73

    主题

    1552

    回帖

    9万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    96973

    QQ 章笑傲江湖章灌水大神章推广专家

    4
    发表于 2019-3-18 08:44:03 | 只看该作者
    感谢分享又一种图片词典处理方案,辛苦了!
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    5
     楼主| 发表于 2019-3-18 10:20:57 | 只看该作者
    kriskr 发表于 2019-3-17 23:41
    vlookup可以详细解释下那四行分别是什么意思吗?谢谢了这个教程很详细

    kriskr 兄:
    哇 ! vlookup 那個功能可能我解釋的不會比網上或書本來的清楚
    lookup_value : 是你要以哪一欄位位址為準去參考對映到你欄位位址
    Tabble_array : 是你要對映的參考 table 的名稱
    Col_index_num: 是你要對映的參考 table 的欄位
    range_lookup : ~~~~看excel 上面的解釋


    2019-03-18_101311.png (7.13 KB, 下载次数: 0)

    2019-03-18_101311.png
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    6
     楼主| 发表于 2019-3-18 11:35:27 | 只看该作者
    本帖最后由 喬治兄 于 2019-3-18 11:44 编辑
    oversky 发表于 2019-3-18 07:13
    “虽不中亦不远矣”的思路很有创见。


    oversky 兄:
    其實也就純亂槍打鳥之術
    一般查詢輸入到3~4字元也就差不多能跳出正確那頁了
    主要是能翻到那頁能知道左欄還是右欄和大概位置為主
    只是沒太多體力再去分左欄還是右欄
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    7
     楼主| 发表于 2019-3-18 11:42:51 | 只看该作者
    VimVim 发表于 2019-3-18 08:44
    感谢分享又一种图片词典处理方案,辛苦了!

    VimVim 兄:
    您的 vim 自動方法真是令人眼睛為之一亮
    只是小弟沒用過 vim
    無法參透您提供的方法
  • TA的每日心情
    开心
    2021-5-6 02:30
  • 签到天数: 154 天

    [LV.7]常住居民III

    0

    主题

    234

    回帖

    5492

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    5492
    8
    发表于 2019-3-18 15:36:51 | 只看该作者
    感谢分享,辛苦啦
  • TA的每日心情
    奋斗
    昨天 09:58
  • 签到天数: 1625 天

    [LV.Master]伴坛终老

    73

    主题

    4466

    回帖

    6万

    积分

    翰林院孔目

    Rank: 10Rank: 10Rank: 10

    积分
    60593

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    9
    发表于 2019-3-18 16:47:56 | 只看该作者
    喬治兄能力不得了!
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    10
     楼主| 发表于 2019-3-20 10:08:16 | 只看该作者
    本帖最后由 喬治兄 于 2019-3-20 10:26 编辑
    skydan05 发表于 2019-3-18 16:47
    喬治兄能力不得了!


    skydan05 兄:
    小弟這純瞎搞的
    利用字首把區間切出來, 用 vlookup 把 wordlist 去配此區間的字表而已
    在此區間內亂槍打鳥
    不一定打中
    最好是有此辭典的 wordlist 來配才能百發百中
    當然最重要的是wordlist排序一定要和字典排序一樣
    字首表也是一樣排序不能有誤
    需按那規則排序且檢查頁碼不能於按處理過的單字排序後有誤
    則基本上才能配對區間
    哈! 哈! 哈!


  • TA的每日心情
    开心
    2022-6-5 11:40
  • 签到天数: 814 天

    [LV.10]以坛为家III

    7

    主题

    1124

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    12933

    灌水大神章

    11
    发表于 2019-3-20 19:13:20 | 只看该作者
    乔治兄:

    长久以来小弟我在自己所掌握的知识范围内苦苦思索编辑图片版词头的方法而终究不得要领。如今您此文所述方法,特别是vlookup函数的运用,简直是醍醐灌顶,使小弟我茅塞顿开,解决了小弟长久以来的疑惑,这样编辑图片版词头就易如反掌了(前提是有比较相近的词头列表的情况下)。

    由衷得感谢和深深地致敬!

    该用户从未签到

    123

    主题

    1719

    回帖

    3万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    30382

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    12
    发表于 2019-3-20 19:20:34 | 只看该作者
    Budha 发表于 2019-3-20 19:13
    乔治兄:

    长久以来小弟我在自己所掌握的知识范围内苦苦思索编辑图片版词头的方法而终究不得要领。如今您此 ...

    EXCEL要好好利用!VLOOKUP等函数我常用。。。
  • TA的每日心情
    开心
    2022-6-5 11:40
  • 签到天数: 814 天

    [LV.10]以坛为家III

    7

    主题

    1124

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    12933

    灌水大神章

    13
    发表于 2019-3-20 20:36:29 | 只看该作者
    chigre3 发表于 2019-3-20 19:20
    EXCEL要好好利用!VLOOKUP等函数我常用。。。

    C大所言极是!得您不吝赐教制作切图版词典的方法,至今还未做出一部成品,一直以来比较惭愧,以后若机缘合适我会尝试制作一部出来。
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    14
     楼主| 发表于 2019-3-21 09:42:40 | 只看该作者
    本帖最后由 喬治兄 于 2019-3-21 10:18 编辑
    Budha 发表于 2019-3-20 19:13
    乔治兄:

    长久以来小弟我在自己所掌握的知识范围内苦苦思索编辑图片版词头的方法而终究不得要领。如今您此 ...


    Budha 兄:
    您過譽了
    小弟搞來搞去也就只會那幾招也教不了有什深度一點的
    承蒙您不棄小弟這土法煉鋼亂槍打鳥之術
    謝謝啦
    [工具] (更新)图片版mdx源文件生成工具
    tsiank 兄 已提供完美秒殺生成工具, https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33574&extra=&page=1

  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    15
     楼主| 发表于 2019-3-21 10:00:37 | 只看该作者
    chigre3 发表于 2019-3-20 19:20
    EXCEL要好好利用!VLOOKUP等函数我常用。。。

    chigre3 兄:
    您那製作法才是精品之道
    真令小弟讚嘆卻又難以仿效
    主要是OCR和校對太累
    切圖詞典才是終極目標
    感謝chigre3 兄多次指點迷津
    解答許多製作上的疑難雜症之困惑
    讓圖片式辭典在製作上更加順暢
    Thanks Again