查看: 1017|回复: 0
打印 上一主题 下一主题

[词典讨论] 闲聊词典的查得率..

[复制链接]

该用户从未签到

19

主题

593

回帖

25万

积分

状元

Rank: 9Rank: 9Rank: 9

积分
259792

灌水大神章小蜜蜂章笑傲江湖章

跳转到指定楼层
1
发表于 2015-10-30 21:40:33 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
起源是底下这里, 与某颜值词典
https://www.pdawiki.com/forum/fo ... hread&tid=13689
不过那时没有详细统计哪些字查不到.

最近发现Dict Source Editor这个好工具, 统计起来就更方便了(感谢作者)
使用最近某位楼主提供的”可口可乐两万”常用词为准(也感谢该楼主)
“可口两万”原本是202xx个词条, 合并后1764x个词条
“新O2” 原本是9551x个词条, 合并后 9253x个词条
加上派生词 2257x合并后 11504x个词条

“新O2”和 “可口两万”, 用正则比对
未加派生词3135个词条 查不到, 例如 usually
加上派生词仍有1716个词条查不到, 例如 supposed
部分是因为大小写, 或是 – 符号等造成查不到, 就不仔细计算了

比较同门的O9, 原本是5997x个词条, 合并后词条数相同
“O9”和 “可口两万”, 用正则比对
总共是1451个词条 查不到, 例如 teen

所以 O9虽然收词数较少, 但常用词反而比较容易查到..
新O2, 有些常用词在O2015可以查到, 但是却没收录, 不太了解编著者的想法.