查看: 24169|回复: 203
打印 上一主题 下一主题

[英英] Macmillan British English 2019(麦克米伦英语词典)——离线整合版

    [复制链接]
  • TA的每日心情
    开心
    2019-2-22 08:41
  • 签到天数: 1 天

    [LV.1]初来乍到

    5

    主题

    92

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15320
    跳转到指定楼层
    1
    发表于 2019-4-16 11:56:49 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
    记录付费主题, 价格: 10 粒米
    本帖最后由 gzq830510 于 2019-6-9 10:29 编辑
    Update2:
    自己用蹩脚丑陋的css语句将之前提到的排版问题进行了调整,基本达到目标,定版,无重大问题不再修改更新!


    Update:
    1. 关于跳转超链:超大量交叉跳转是macmillan词典的一大特色,释义、例句、短语中无处不在,我本想对跳转超链加下划线区分的,发现加上后全是下划线……不好看,而且我ebdic即使源词典没设超链也能随意跳转,所以就没加,缺点是不好区分哪些是超链可以点~
    2. RelatedWords框内的内容是可以滚动显示的,虽然有的词典内不无法显示滚动条
    3. 更新了css,主要是隐藏了thes词条中show me more 和 show me less 文字,全部内容直接显示、relatedwords 样式修改、删除释义重复序号(感谢Android大佬)等微调。
    4. 更新了下mdx文件——
    整合了由一奇葩bug引发的6个词条没整合到一起的错误;
    修正了2个单词释义重复显示问题(可能仍有纰漏);
    删除了buzzWord中的28个特殊广告标记;
    同时提供了大小写是否敏感两个mdx版本。

    改成默认大小写敏感的原因主要是可以解决楼下提出的当thes 与 普通词条 仅大小写不同时无法正确跳转到位置靠后的thes词条问题(我核对了下这样的词条整整有100个,如Friendly),而且我试了试,大家一般都不会只用一部词典,用多部时好像我查TiGeR这样的大众化单词大小写敏感的macmillan也能出查询结果~

    另外,寻求大佬解决两个css显示的问题(均只在pc的goldendict上异常, ebdic可以正常显示):1. 释义序号(SENSE-NUM)在我的goldendict上是单独成行显示的,太占空间,我强制和释义搞到一行又会引发缩进问题,怎么能排到一行又不改变现有缩进?
    2. 词条的词行变化我想设单设一行且左对齐,但goldendict上总是动态的排在词频那个星星后面, 希望能够更美观些~

    Macmillan British English 2019, 这是萌新继Wiktionary 2019后的制作的第二部字典,4月初完工后一直自用测试中,由于交易区一朋友发表了Macmillan的美语版,为了支持他,特把我的发布时间推迟了一周。
    一、制作初衷
    两年前我用论坛里的Macmillan替换了柯林斯,感觉其释义简洁易懂较有特色,虽然论坛里也一直有新版的麦可米伦发布,但一直没发现我用的Macmillan+English+Dictionary+and+Thesaurus+2nd+Ed这个全离线版本的升级版,刚好19年春节后想自学python,看了Python Crash Course、Learn Python3 the Hard Way及Python网络数据采集这几本书,想做个大作业检验下学习情况,所以就拿这个来练手了。
    二、难点障碍
    对我而言,制作这部词典最花时间的是数据抓取环节,因为没index或wordlist,只能扒站,但又只想抓特定路径下的数据,试了好多种工具,感觉实际效果很奇葩,到现在也没弄清楚为啥不同工具甚至同一工具每次尝试抓取结果都不一样……其次是词条跳转,因为macmillan词条中跳转超级多而且有很多错误,我又做了词条整合,给跳转带来很大麻烦~
    三、已知问题
    1. 存在兼容性问题,主要适配的我主用的手机端ebdic,桌面端goldendict好像都有点小问题……
    2. css文件有很大完善空间,对网页前端设计不太熟,一开始我是基于官网css改了一个版本,不太好看,后来在论坛里YYang.改写的美语版本基础上进行了更改,但还不是特别般配,希望高手美化一下。
    3. 词典中内嵌了近70个youtube短视频链接,但不管是我用网页链接、真实下载地址链接还是下载成离线mp4文件,在ebdic和goldendict中都无法正常显示,而且视频搞成离线的话也要将近1G空间,所以放弃了,用css隐藏。
    四、词典特点
    1. 基于官网Brtish English版本制作,数据截止日期2019年3月31日,整合后的词条总数为68995条。之所以取british版是我已经用美传作为主力词典之一了,而且英语版词条数多一些。
    2. 全部资源离线化,文字、图片、语音等。
    3. 包括open dictionary所有内容
    4. 包括thesaurus所有内容
    5. 包括buzzword,约600多个
    6. 包含当前官网上500多幅图(主要是国旗、颜色、动植物),同时也把原先学习词典版本中的700多幅图整合了进来。
    7. 整合展示离线英音(蓝喇叭)及美音(红喇叭)
    8. 词条整合,官网中不同词性算不同词条,如pardon分pardon_1、pardon_2、pardon_3三个词条,本词典整合到一起只算一个,同时buzzWord也进行了整合。
    9. 尽可能完美的实现了页内及跨页跳转。由于词条整合,这个难度比较大,手机端ebdic效果最好,桌面存在部分小问题……而且官网上存在非常多的坏链或无效跳转(因为词条释义在不断扩充,但跳转锚点标记很多没同步更新),我已经进行了大量修正,不过需要语义环境才能判断的无效跳转暂时放弃没有处理。
    10. 虽然是英语词典,但最大程度的整合了美语词典(Ameican English)独特内容,包括3000+词条、100+thesaurus 及 全部的美语发音。

    五、截图展示:




    由于下面我想自学高级数据分析方面的内容,这应该是我2019年做的最后一部词典,除非重大bug不会更新,各位可以随便下载、使用及修改,如转载的话注明来源即可。
    喜欢的话欢迎评分鼓励!~.~

    链接:https://pan.baidu.com/s/1u9bMyXKS5vtMY7vEVfExPg 提取码: tfwa






    评分

    28

    查看全部评分

    本帖被以下淘专辑推荐:

  • TA的每日心情
    开心
    2018-8-26 14:41
  • 签到天数: 45 天

    [LV.5]常住居民I

    13

    主题

    121

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    16623
    推荐
    发表于 2019-4-16 15:32:06 | 只看该作者
    本帖最后由 Android 于 2019-4-16 15:33 编辑

    cuckoo词条重复了三次,官网没有这些问题,是楼主处理的过程中弄错了。

    由于楼主并不是从index爬取的,因此缺少下面这些单词:
    alkene
    alligator gar
    AMD
    arabica
    arrow loop
    beamer
    bestowal
    Brincel
    butt lift
    catty-corner
    CAZ
    cholesterol-free
    cloth-eared
    commutator
    compostable
    consignee
    customization
    denturist
    Denverite
    ERG
    ergothioneine
    event horizon
    flextension
    gourmet coffee
    haint
    haint blue
    handsel
    Hasidic
    herd immunity
    holosexual
    homeroom
    hooliganism
    impanel
    interactional
    isolation booth
    JSYK
    laryngopharyngeal
    Letzeburgesch
    LEZ
    lochan
    loutishness
    mangosteen
    marmalize
    meatless
    NICU
    onomatopoeic
    OOMF
    optimizer
    overgeneralisation
    padded jacket
    personalisation
    PMQs
    political capital
    proprietorship
    puffer jacket
    quartic
    reflux
    repill
    scaleable
    side hustle
    silver economy
    smart quotes
    straight quotes
    substantia nigra
    syllabary
    tampon tax
    telecommunicator
    Telugu
    Tenglish
    Terpsichore
    tetched
    the Woolsack
    throwawayable
    Tollywood
    topsail
    triple down
    trustor
    Ulez
    videogram
    webtool
    word pool

    点评

    cuckoo重复3次是扒站时下载到了内容一样的cuckoo_1和cuckoo_2,然后又加了一个美语版cuckoo,新加的美语词条我已考虑了此类重复,但还有疏漏,楼主厉害!  发表于 2019-4-16 16:03
    又检查了下,老哥你这list好像是对照着最新的index梳理的,这里面缺的次90%以上是open dictionary四月份这半个月来新收录的词,而我截止日期3.31日。  发表于 2019-4-16 15:58
  • TA的每日心情
    擦汗
    2020-11-13 17:42
  • 签到天数: 93 天

    [LV.6]常住居民II

    5

    主题

    184

    回帖

    3018

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3018

    QQ 章

    QQ
    推荐
    发表于 2019-4-16 14:47:24 | 只看该作者
  • TA的每日心情
    开心
    2019-2-22 08:41
  • 签到天数: 1 天

    [LV.1]初来乍到

    5

    主题

    92

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15320
    推荐
     楼主| 发表于 2019-5-18 19:43:29 | 只看该作者
    本帖最后由 gzq830510 于 2019-5-18 19:46 编辑
    petergaoshanwei 发表于 2019-5-18 13:17
    楼主打扰了 ,能不能进一步提取一下短语,参照了网页在线版和cracode版的麦克米伦,发现您这一版有好多短语 ...

    这部词典现在的策略是精准匹配,因此只要与词条有一丁点不匹配就查询不到(包括大小写不同)……这肯定会给实际使用带来一些问题。
    解决的方案比较理想的是引入模糊匹配策略。但这个模糊匹配按理是应该由词典软件来统一提供的,而不是由每个mdx文件来处理(mdx当前的机制也不太适合处理)。
    我理解的模糊匹配有两块内容:
    一、模糊处理由用户主导,方式主要是引入通配符或更厉害的正则,这块实现相对简单些,我手机端ebdic是支持的,比如ebdic中输入 in*fact就可以在本mdx文件中匹配到对应的词条啦~
    二、模糊处理由词典软件主导,方式主要是根据关键词相似度及其他逻辑知识对输入的查询词进行模糊处理,实现智能纠错&智能推荐,比如输入teech自动按teach查,这个由于推荐的结果不一定就是用户真正想要的,基本上都只是在输查询词时在下方给出一些提示或建议。
    最后,如果只从mdx文件着手,由于你提到的这些短语属于3大类:有/或()或仅在单词的释义中出现,比较原始的处理策略就是拆分增加词条,比如针对here you are/go,新增here you are和here you go两个词条就行了,计算机处理的话主要是字符串处理(正则匹配等),不难但复杂组合下也还是有一定的工作量,由于本人目前对这方面需求并不是很强,也需后续空闲时会更新一下
  • TA的每日心情
    开心
    2019-2-22 08:41
  • 签到天数: 1 天

    [LV.1]初来乍到

    5

    主题

    92

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15320
    推荐
     楼主| 发表于 2019-4-23 18:45:37 来自手机 | 只看该作者
    hmkenny 发表于 2019-4-23 18:03
    以前的MED2可以查到词组chicken out,这个版本不行

    默认大小写敏感,区分词条的大小写,chicken out放在chicken最下面动词格式部分,和官网最新数据保持一致~
  • TA的每日心情

    2020-2-20 11:17
  • 签到天数: 164 天

    [LV.7]常住居民III

    4

    主题

    358

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    23057
    推荐
    发表于 2019-4-16 18:19:27 | 只看该作者

    css小白只能到这一步了,标签部分还是有问题,如果大佬有空,希望能修改一下造福大众。



    entry.zip

    8.57 KB, 下载次数: 137, 下载积分: 米 -5 粒

    点评

    修改后的css已经解决了最明显的几个问题,谢谢!  发表于 2019-4-16 20:23
  • TA的每日心情
    开心
    2019-2-22 08:41
  • 签到天数: 1 天

    [LV.1]初来乍到

    5

    主题

    92

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15320
    推荐
     楼主| 发表于 2019-4-16 17:04:56 | 只看该作者
    elusty 发表于 2019-4-16 16:23
    发现序号重复的小问题,Goldendict PC

    这个问题我桌面版也遇到了,手机端没问题…… 外面那个1. 2. 的序号不知道怎么来的,css中没看到counter之类的计数器啊,等大神解决吧~

    点评

    因为ol和li标签搭配就会产生有序列表(就是1. 2. 3.等等) 解决方法,在css文件添加一行就行了ol {list-style-type: none;}  发表于 2019-4-16 20:16
  • TA的每日心情
    开心
    2020-3-25 07:07
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    129

    主题

    2411

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    17796

    灌水大神章小蜜蜂章笑傲江湖章

    推荐
    发表于 2019-4-16 16:23:52 | 只看该作者
    gzq830510 发表于 2019-4-16 15:04
    刚更新了下css文件,隐藏掉了,默认show me more所有内容直接显示,希望这个更改没引入新的问题~{:4_104: ...

    发现序号重复的小问题,Goldendict PC

    MEDo.jpg (36.28 KB, 下载次数: 3)

    MEDo.jpg
  • TA的每日心情
    无聊
    2022-9-25 21:09
  • 签到天数: 1136 天

    [LV.10]以坛为家III

    17

    主题

    3142

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    25291

    灌水大神章

    推荐
    发表于 2019-4-16 15:29:58 | 只看该作者
    编号有些小问题。

    000156.png (43.94 KB, 下载次数: 1)

    000156.png
  • TA的每日心情

    2019-5-4 11:17
  • 签到天数: 36 天

    [LV.5]常住居民I

    0

    主题

    184

    回帖

    1387

    积分

    禁止发言

    积分
    1387
    QQ
    推荐
    发表于 2019-4-16 12:42:49 | 只看该作者
    本帖最后由 黑色的天 于 2019-4-16 14:39 编辑

    我用的是电脑端的goldendict,
    我这里释义的数字标签显示有问题,全都显示两遍,而且也没有楼主截图中的红色字体显示。不知道你们有没有这个问题。

    另外建议把related words放在最后比较合理吧。

    顶顶顶顶.png (139.55 KB, 下载次数: 1)

    顶顶顶顶.png
  • TA的每日心情
    开心
    2019-2-22 08:41
  • 签到天数: 1 天

    [LV.1]初来乍到

    5

    主题

    92

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15320
    推荐
     楼主| 发表于 2019-4-16 12:24:23 来自手机 | 只看该作者
    本帖最后由 gzq830510 于 2019-4-16 18:40 编辑

    补充说明一些东西:
    1. 关于跳转超链:超大量交叉跳转是macmillan词典的一大特色,释义、例句、短语中无处不在,我本想对跳转超链加下划线区分的,发现加上后全是下划线……不好看,而且我ebdic即使源词典没设超链也能随意跳转,所以就没加,缺点是不好区分哪些是超链可以点~
    2. 更新了css,主要是隐藏了thes词条中show me more 和 show me less 文字,全部内容直接显示。

    3. RelatedWords框内的内容是可以滚动显示的,虽然有的词典内不无法显示滚动条
    4. 更新了下mdx文件,删除了大佬指出的cuckoo重复释义, 同时直接把Related Words 那个框上面的Other entries for this word那个链接删掉了(本来想css隐藏的,但觉得对自己没用~)



  • TA的每日心情
    开心
    2020-4-12 13:04
  • 签到天数: 453 天

    [LV.9]以坛为家II

    41

    主题

    2084

    回帖

    3万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    36425

    灌水大神章QQ 章笑傲江湖章

    2
    发表于 2019-4-16 12:05:11 | 只看该作者
    太棒了,先赞再存。
  • TA的每日心情
    开心
    2021-4-24 08:20
  • 签到天数: 634 天

    [LV.9]以坛为家II

    5

    主题

    2595

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    18143
    3
    发表于 2019-4-16 12:08:03 | 只看该作者
    非常感谢大侠的无私奉献    非常喜欢Macmillan   以前是在电脑里专门安装的Macmillan English Dictionary 2nd Edition这个词典的软件   的确  感觉其释义归类比较简洁  不是很细很复杂的那种   很好用
  • TA的每日心情

    2020-4-3 21:34
  • 签到天数: 106 天

    [LV.6]常住居民II

    5

    主题

    402

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10831

    笑傲江湖章QQ 章灌水大神章

    4
    发表于 2019-4-16 12:17:49 | 只看该作者
    非常棒,感谢您的分享,万分感谢!
  • TA的每日心情
    开心
    1 小时前
  • 签到天数: 1060 天

    [LV.10]以坛为家III

    7

    主题

    2432

    回帖

    5万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    54200

    笑傲江湖章灌水大神章

    5
    发表于 2019-4-16 12:20:17 | 只看该作者
    继ff大以后出现的一个大侠!!!谢谢大侠分享经典词典!!!
  • TA的每日心情
    开心
    8 小时前
  • 签到天数: 1956 天

    [LV.Master]伴坛终老

    0

    主题

    2542

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    25547

    灌水大神章QQ 章

    7
    发表于 2019-4-16 12:28:22 | 只看该作者
    超级棒,感谢楼主无私地分享
  • TA的每日心情
    开心
    2022-1-21 00:52
  • 签到天数: 699 天

    [LV.9]以坛为家II

    17

    主题

    1756

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    19583
    8
    发表于 2019-4-16 12:28:28 | 只看该作者
    词典制作不易,支持楼主!
  • TA的每日心情
    奋斗
    2022-10-21 20:59
  • 签到天数: 282 天

    [LV.8]以坛为家I

    1

    主题

    535

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    18078
    9
    发表于 2019-4-16 12:29:32 | 只看该作者
    楼主威武,感谢无私分享!
  • TA的每日心情
    慵懒
    2021-9-28 14:33
  • 签到天数: 158 天

    [LV.7]常住居民III

    5

    主题

    907

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    17310

    QQ 章灌水大神章笑傲江湖章推广专家

    10
    发表于 2019-4-16 12:31:37 | 只看该作者
    你的安卓系统是什么版本?我的安卓8.0用ebdic/ebdix都直接崩溃。
  • TA的每日心情

    2019-9-20 08:37
  • 签到天数: 214 天

    [LV.7]常住居民III

    18

    主题

    664

    回帖

    2万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    25837

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    11
    发表于 2019-4-16 12:32:30 | 只看该作者
    本帖最后由 HMPT 于 2019-4-16 12:35 编辑

    制作辛苦!~~
    其实index是有的
    https://www.macmillandictionary.com/browse/
  • TA的每日心情
    奋斗
    7 小时前
  • 签到天数: 1626 天

    [LV.Master]伴坛终老

    73

    主题

    4467

    回帖

    6万

    积分

    翰林院孔目

    Rank: 10Rank: 10Rank: 10

    积分
    60653

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    12
    发表于 2019-4-16 12:35:06 | 只看该作者
    谢谢gzq830510分享!!!
  • TA的每日心情
    无聊
    2023-3-13 11:45
  • 签到天数: 1538 天

    [LV.Master]伴坛终老

    81

    主题

    4430

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    12018
    13
    发表于 2019-4-16 12:37:24 | 只看该作者
    是我想要的,谢谢
  • TA的每日心情
    开心
    2019-2-22 08:41
  • 签到天数: 1 天

    [LV.1]初来乍到

    5

    主题

    92

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15320
    14
     楼主| 发表于 2019-4-16 12:40:23 来自手机 | 只看该作者
    HMPT 发表于 2019-4-16 12:32
    制作辛苦!~~
    其实index是有的

    https://www.macmillandictionary.com/browse/

    哇,真有啊,早知道就省很多功夫,我抓站点数据时看到browse目录了,但不知道是干啥用的????
  • TA的每日心情
    慵懒
    2019-10-9 07:06
  • 签到天数: 398 天

    [LV.9]以坛为家II

    1

    主题

    717

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11148

    QQ 章

    16
    发表于 2019-4-16 12:43:12 | 只看该作者
    词典制作不易,支持楼主!
  • TA的每日心情
    奋斗
    昨天 18:23
  • 签到天数: 774 天

    [LV.10]以坛为家III

    1

    主题

    1052

    回帖

    5807

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    5807
    17
    发表于 2019-4-16 12:51:25 | 只看该作者
    太棒了
    有特色的词典而且资源稀少
    感谢无私分享
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79351

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    18
    发表于 2019-4-16 12:56:34 | 只看该作者
    讚喔
    Macmillan 最精美的一本
  • TA的每日心情
    慵懒
    2022-2-1 17:46
  • 签到天数: 105 天

    [LV.6]常住居民II

    4

    主题

    229

    回帖

    2917

    积分

    解元

    Rank: 5Rank: 5

    积分
    2917
    19
    发表于 2019-4-16 12:59:36 | 只看该作者
    thumbs up!
    many thanks!
  • TA的每日心情
    擦汗
    2021-2-23 22:06
  • 签到天数: 114 天

    [LV.6]常住居民II

    2

    主题

    228

    回帖

    5707

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    5707
    20
    发表于 2019-4-16 13:03:57 | 只看该作者
    学以致用,楼主真棒????我也想要学习!谢谢楼主的鼓励
  • TA的每日心情
    无聊
    2019-3-30 11:08
  • 签到天数: 2 天

    [LV.1]初来乍到

    1

    主题

    5

    回帖

    146

    积分

    童生

    Rank: 2

    积分
    146
    21
    发表于 2019-4-16 13:13:44 | 只看该作者
    感谢无私分享。谢谢G大
  • TA的每日心情
    开心
    昨天 14:12
  • 签到天数: 1696 天

    [LV.Master]伴坛终老

    3

    主题

    2809

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    72415
    22
    发表于 2019-4-16 13:15:02 | 只看该作者
    非常感谢您的辛苦制作与无私分享!
  • TA的每日心情

    2019-9-20 08:37
  • 签到天数: 214 天

    [LV.7]常住居民III

    18

    主题

    664

    回帖

    2万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    25837

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    23
    发表于 2019-4-16 13:15:24 | 只看该作者
    gzq830510 发表于 2019-4-16 12:40
    哇,真有啊,早知道就省很多功夫,我抓站点数据时看到browse目录了,但不知道是干啥用的???? ...

    不过 mac的词典 死链也很多
    之前抓过这个数据, 所以知道一些
  • TA的每日心情
    开心
    6 小时前
  • 签到天数: 641 天

    [LV.9]以坛为家II

    3

    主题

    1077

    回帖

    7302

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    7302
    24
    发表于 2019-4-16 13:16:17 | 只看该作者
    作者做的很细,介绍的也很详尽,这正是大家所欢迎的!非常感谢分享!
  • TA的每日心情
    开心
    2019-2-22 08:41
  • 签到天数: 1 天

    [LV.1]初来乍到

    5

    主题

    92

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15320
    25
     楼主| 发表于 2019-4-16 13:23:09 来自手机 | 只看该作者
    HMPT 发表于 2019-4-16 13:15
    不过 mac的词典 死链也很多
    之前抓过这个数据, 所以知道一些

    的确很多坏链接,词条坏链我是根据文件大小及基本结构进行自动初步筛查,然后再人工确定~而且语音文件有部分仅大小写不一样的,而win下又不区分大小写……重名直接覆盖了,好在我是linux加windows双平台进行的,发现了这个问题