查看: 441|回复: 2
打印 上一主题 下一主题

[词典校勘] 谷歌词典的数据分析

[复制链接]

该用户从未签到

131

主题

2650

回帖

3万

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
34126

灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

跳转到指定楼层
1
发表于 2018-3-1 09:46:29 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 eeshu 于 2018-3-1 09:46 编辑

详细研究了一下谷歌词典,发现详细释义部分其实取自The Oxford Dictionary of English,连例句和同义词这部分也是照抄无遗。请看tug和whimper条的截图:









如果展开下拉折叠部分看同义词详单的话,牛津的痕迹就更加明显了。比如tell条同义词比较多,我们来对比对比。



这部分同样抄了The Oxford Thesaurus of English,请看



显然,两部分牛津的内容都更加详细,而且更新。谷歌应该是买了老版本的牛津数据版权。论坛有本双解版的《新牛津》就是老版的,对照一下会发现谷歌内容一模一样。比如刚才查的whimper的解释,动词第一条是(of a person or animal) make a series of low, feeble sounds expressive of fear, pain, or discontent。其中的(of a person or animal)在新版中已经删除。名词解释也有调整,a low, feeble sound expressive of such emotions在新版中已经降为a whimpering sound 的下级释义。



倒是谷歌的详细例句部分,好像与牛津的例句有较大不同(BT大做的ODE是两年前的,现在的官网内容例句已经大幅增加,所以我们拿官网截图来比较比较)。还是whimper条:





我粗粗对比了一下,两部分相同的例句有20多条。看来谷歌可能利用自己的海量数据还是增加了一部分自己的例句。不过,牛津官网的例句数量远远多于谷歌的。只可惜BT大觉得牛津官网更新后删了一些老版中有用的内容(比如词源详解和rhyme),不肯再制作更新版本。

所以,经过上面一番对比,真正是谷歌自己独特数据的恐怕只有英汉简译部分。




评分

2

查看全部评分

  • TA的每日心情
    奋斗
    昨天 09:58
  • 签到天数: 1625 天

    [LV.Master]伴坛终老

    73

    主题

    4466

    回帖

    6万

    积分

    翰林院孔目

    Rank: 10Rank: 10Rank: 10

    积分
    60593

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    2
    发表于 2018-3-1 17:21:19 | 只看该作者
    研究的细致!!!赞一个!!!
  • TA的每日心情
    奋斗
    2020-4-23 21:09
  • 签到天数: 538 天

    [LV.9]以坛为家II

    12

    主题

    847

    回帖

    68万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    683311

    QQ 章推广专家笑傲江湖章灌水大神章

    3
    发表于 2018-9-5 05:27:21 | 只看该作者
    感谢大神分析!赞