查看: 6230|回复: 22
打印 上一主题 下一主题

[词典校勘] worldbookonline中WorldBookDictionary的瑕疵(20131118)

[复制链接]

该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

跳转到指定楼层
1
发表于 2013-11-18 21:43:31 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 Oeasy 于 2013-11-19 14:55 编辑


http://worldbookonline.com/advanced/dict?lu=susy-q&cl=2页面截图


红框处词头URL为:
http://worldbookonline.com/advanced/dict?lu=su'3'%20symmetry&cl=2
点击则提示:

There are no matching entries for “su'3' symmetry”.

这个词的实际链接应为:
http://worldbookonline.com/advanced/dict?lu=SU%283%29



同样的情况还有至少两处:
http://worldbookonline.com/advanced/dict?lu=ad eundem 'gradum'&cl=2   |ad eundem 'gradum'

实际链接:http://worldbookonline.com/advanced/dict?lu=ad+eundem

http://worldbookonline.com/advanced/dict?lu=fifteen minutes 'of fame',&cl=2|fifteen minutes 'of fame',

实际链接:http://worldbookonline.com/advanced/dict?lu=fifteen+minutes

=====
还有很多其他问题,不列举了。

该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

2
 楼主| 发表于 2013-11-19 08:01:58 | 只看该作者
本帖最后由 Oeasy 于 2013-11-19 08:08 编辑


在线的应该是2011年版。
http://store.worldbook.com/products/print-english-dictionary 这里WBD的ISBN是978-0-7166-0203-3,但是没找着出版时间啊。
World Book Dictionary
$99.00
……
ISBN: 978-0-7166-0203-3
Volumes: 2
Pages: 2560
Trim Height: 10 7/8
Trim Width: 8 3/8
Interest Level: Grades 4+

搜了下
http://www.worldbook.com.au/LiteratureRetrieve.aspx?ID=81942
这里有个PDF,


==
这里
http://d27vj430nutdmd.cloudfront ... 4b99057d2d99e7b.pdf

ISBN: 978-0-7166-0203-3. SKU: 20282. 2 volumes • 2,560 pages. 8 3/8" x 10 7/8". Copyright: 2011.


该用户从未签到

9

主题

162

回帖

1983

积分

解元

Rank: 5Rank: 5

积分
1983

灌水大神章小蜜蜂章笑傲江湖章

3
发表于 2013-11-21 01:47:29 | 只看该作者
本帖最后由 yaodis 于 2013-11-21 01:49 编辑

你想说明什么
对mdx没影响吧

该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

4
 楼主| 发表于 2014-1-31 10:32:15 | 只看该作者
World Book Dictionary有一个优点,就是它使用普通的字符来注音,对字体、对操作系统零要求,都可以完美显示。

刚折腾一老旧xp机,发现N部词典的音标在GoldenDict下都显示不全,那些音标字符在记事本里也显示不出来,不过用MDict(类似于浏览器)则正常显示。而WBD由于音标也是普通字符,所以完美显示。

该用户从未签到

10

主题

115

回帖

759

积分

举人

Rank: 4

积分
759
5
发表于 2014-2-6 18:25:12 | 只看该作者
还有纸质版啊

该用户从未签到

59

主题

960

回帖

8774

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
8774

灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

6
发表于 2014-8-9 11:02:38 | 只看该作者
Oeasy 发表于 2014-1-31 10:32
World Book Dictionary有一个优点,就是它使用普通的字符来注音,对字体、对操作系统零要求,都可以完美显示 ...

音标用Lucida Sans Unicode可以显示出来,字体也比较好看

world book的音标确实比较独特

该用户从未签到

59

主题

960

回帖

8774

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
8774

灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

7
发表于 2014-8-15 12:02:24 | 只看该作者
WBD2011缺以下单词:
apothecaries' measure
apothecaries' weight
avoirdupois weight
chain measure
circular measure
cubic measure
ditto mark
dry measure
kiwi
linear measure
liquid measure
medium-term
mouth
ponytail
square measure
surveyor's measure
troy weight

该用户从未签到

42

主题

1737

回帖

2万

积分

状元

Rank: 9Rank: 9Rank: 9

积分
20641

灌水大神章小蜜蜂章笑傲江湖章

8
发表于 2014-8-15 12:40:45 | 只看该作者
bt4baidu 发表于 2014-8-15 12:02
WBD2011缺以下单词:
apothecaries' measure
apothecaries' weight

可以从World Book Encyclopedia DVD中补齐。

该用户从未签到

59

主题

960

回帖

8774

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
8774

灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

9
发表于 2014-8-15 12:52:34 | 只看该作者
world book逐渐没落了,词典基本退出主流,百科前途也不乐观

维基问世以后,这年头谁还做百科辞典就是找死。
我估计95%以上的传统百科五到十年之内都会灭亡
大英百科应该好一点,毕竟历史悠久,有权威性,而且在线版时效性也不差
未来有可能是维基、大英双寡头的局面

该用户从未签到

59

主题

960

回帖

8774

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
8774

灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

10
发表于 2014-8-16 14:31:20 | 只看该作者
bt4baidu 发表于 2014-8-15 12:02
WBD2011缺以下单词:
apothecaries' measure
apothecaries' weight

拼写谬误极多!该词典编辑极不负责,以下HTML实体代码都是瞎写杜撰,令人瞠目,一部分根据旧版和上下文可以订正:
  1.     text=text.replace('&#160<BR>', '&#160;<BR>')
  2.     text=text.replace('&upstar; or &downstar;', '\xe2\x81\x82')
  3.     text=text.replace('&caron;', '\xcb\x87')
  4.     text=text.replace('&Ggr;', '\xCE\x93')
  5.     text=text.replace('&KHgr;', '&Chi;')
  6.     text=text.replace('&khgr;', '&chi;')
  7.     text=text.replace('&Rgr;', '&rho;')
  8.     text=text.replace('&Igr;', '&iota;')
  9.     text=text.replace('&Sgr;', '&sigma;')
  10.     text=text.replace('&Tgr;', '&tau;')
  11.     text=text.replace('&Ogr;', '&omicron;')
  12.     text=text.replace('&check;', '\xe2\x9c\x93')
  13.     text=text.replace('&chevron1;', '^')
  14.     text=text.replace('&chevron2;', '\xef\xb8\xbd')
  15.     text=text.replace('&conjunction;', '&and;')
  16.     text=text.replace('&sqrt&#173;1;', '&radic;-1')
  17.     text=text.replace('&sqcup;', '\xe2\x8a\x94')
  18.     text=text.replace('&flat;', '\xe2\x99\xad')
  19.     text=text.replace('&mldr;', '\xe2\x80\xa6')
  20.     text=text.replace('''<a href="javascript:showEntry('gender&lsqb;&etydf;Old French ', 'ent_052676')" target="_top"><B>gender[&#060;&#160;Old French </B>.</a>]''',
  21.     '''<a href="javascript:showEntry('gender', 'ent_052676')" target="_top"><B>gender</B>.</a>[&#060;&#160;Old French]''')
  22.     text=text.replace('&Dgr;', '&Delta;')
  23.     text=text.replace('&dgr;', '&delta;')
  24.     text=text.replace('&ugr;', '&upsilon;')
  25.     text=text.replace('&assocpress;', '<span style="letter-spacing:-2px"><i>A</i>P</span>')
  26.     text=text.replace(' or &chemform;', '')
  27.     text=text.replace('&lazyJ;', '<img src="lazyJ.png">')
  28.     text=text.replace('&tprime;', '\'\'\'')
  29.     text=text.replace('&pgr;', '&pi;')
  30.     text=text.replace('&agr;', '&alpha;')
  31.     text=text.replace('&bgr;', '&beta;')
  32.     text=text.replace('&rgr;', '&rho;')
  33.     text=text.replace('&xgr;', '&xi;')
  34.     text=text.replace('&sfgr', '&sigma;')
  35.     text=text.replace('&hyphen;', '\xe2\x80\x94')
  36.     text=text.replace('&square;','X')
  37.     text=text.replace('&cir;','O')
  38.     text=text.replace('&cbrt764;','\xe2\x88\x9b764')
  39.     text=text.replace('&cbrt27;','\xe2\x88\x9b27')
  40.     text=text.replace('&fracacbc;','AC / BC')
  41.     text=text.replace('&fracabbc;','AB / BC')
  42.     text=text.replace('&phgr;','&phi;')
  43.     text=text.replace('&utri;','&#9653;')
  44.     text=text.replace('&rx;', 'Rx')
  45.     text=text.replace('&rdquor;', '&rdquo;')
  46.     p = re.compile(r'(?<=\w)&verbar;(?=\w)')
  47.     text = p.sub(r'', text)
  48.     text=text.replace('&schwa;', '\xc9\x99')
复制代码
尚有几处不知其具体意义,或无对应文字,无法订正:
  1. &fraction1;#mathematic
  2. &fraction2;#mathematic
  3. &fraction3;#mathematic
  4. &shortsyllable;# Greek syllable
  5. &pause;# Greek syllable
  6. &circlestangent;#mathematic
复制代码

该用户从未签到

59

主题

960

回帖

8774

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
8774

灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

11
发表于 2014-8-17 22:02:24 | 只看该作者
本帖最后由 bt4baidu 于 2014-8-17 22:04 编辑

数据极不规则,重排难度极大!目测完工50%左右,还有不少琐碎的排版错误



pic1.png (80.46 KB, 下载次数: 0)

pic1.png

pic2.png (80.34 KB, 下载次数: 0)

pic2.png

该用户从未签到

3

主题

491

回帖

2348

积分

解元

Rank: 5Rank: 5

积分
2348

灌水大神章小蜜蜂章笑傲江湖章

12
发表于 2014-12-26 11:48:50 | 只看该作者
我只用纸质版
  • TA的每日心情
    慵懒
    2023-1-10 21:48
  • 签到天数: 802 天

    [LV.10]以坛为家III

    3

    主题

    2373

    回帖

    2万

    积分

    禁止发言

    积分
    20562

    小蜜蜂章笑傲江湖章灌水大神章

    13
    发表于 2015-4-13 10:14:22 | 只看该作者
    不知哪里能下到PDF版

    该用户从未签到

    59

    主题

    960

    回帖

    8774

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    8774

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    14
    发表于 2015-10-15 15:09:34 | 只看该作者
    这几处链接的问题网站已经改过来了
    不过缺词的问题还没改(实际上这些词有些是被放在了和它相邻的词里面,大概是电子化的时候没有切开)

    apothecaries' measure
    apothecaries' weight
    avoirdupois weight
    chain measure
    circular measure
    cubic measure
    ditto mark
    dry measure
    kiwi
    linear measure
    liquid measure
    medium-term
    mouth
    ponytail
    square measure
    surveyor's measure
    troy weight

    该用户从未签到

    1

    主题

    152

    回帖

    553

    积分

    举人

    Rank: 4

    积分
    553

    灌水大神章小蜜蜂章笑傲江湖章

    15
    发表于 2015-10-16 03:02:39 | 只看该作者
    kiwi这个词在网站上还是链接不上啊.
    应该是在apteryx这个词条下吧.
    哪位坛友有纸质版, 核对黑对:-)

    该用户从未签到

    59

    主题

    960

    回帖

    8774

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    8774

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    16
    发表于 2015-10-29 19:53:37 | 只看该作者
    bt4baidu 发表于 2015-10-15 15:09
    这几处链接的问题网站已经改过来了
    不过缺词的问题还没改(实际上这些词有些是被放在了和它相邻 ...


    在线版缺以下单词:
    ca'
    hook
    succinctorium
    sulfonic acid
    legal age
    lat
    facet
    fixture
    vinta
    o'clock
    off
    play-off
    phaenogamous
    saracenic
    scissors
    sleeping bag
    snaffle bit

    slenium拼写错误,应为selenium

    该用户从未签到

    7

    主题

    818

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    12678

    灌水大神章小蜜蜂章笑傲江湖章

    17
    发表于 2015-10-30 09:15:44 | 只看该作者
    bt4baidu 发表于 2015-10-29 19:53
    在线版缺以下单词:
    ca'
    hook



    软件提取的wbd应该有吧

    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    18
     楼主| 发表于 2015-10-30 09:34:38 | 只看该作者
    本帖最后由 Oeasy 于 2015-10-30 09:36 编辑
    bt4baidu 发表于 2015-10-29 19:53
    在线版缺以下单词:
    ca'
    hook



    这里有个疑似从 World Book&#174; Dictionary, 2 volumes(Eng-Eng) http://lingvodics.com/dics/details/3809/ 转过来的在线版 WBD ,倒是有较全的 hook ,其他几个词没验证,因为看不过来了。。。

    http://useful_english.enacademic.com/65659/hook#sel=512:1,512:1


    hook &#171;wk&#187;, noun, verb.
    –n.
    1. a piece of metal, wood, or other stiff material, curved or having a sharp angle for catching hold of something or for hanging things on. &#187;
    Several people hung their coats on the hook fastened to the wall.

    2. a curved piece of wire, usually with a barb at the end, for catching fish; fishhook. &#187;
    Beauty without grace is the hook without the bait (Emerson).

    3. Figurative. a snare; trap.
    4. a bent metal appliance for fastening together two parts of an article of clothing. See also hook and eye.
    5. anything curved or bent like a hook. &#187;
    I carried the umbrella by putting the hook of the handle over my arm.

    6. a large, curved knife for cutting down grass or grain; sickle.
    7. a sharp bend. &#187;
    a hook in the river.

    8. a curved point of land. &#187;
    the Hook of Holland.

    9. a recurved and pointed organ or appendage of an animal or plant.
    10. the act of hooking.
    11. a curving throw or hit in baseball.
    12. a golf ball's path of flight curving to the left away from a right-handed player.
    13. the act of pulling the ball in cricket.
    14. Bowling. a throw where the ball rolls down the alley, then turns sharply toward the pins.
    15. Boxing. a swinging, usually short blow with the elbow bent and rigid.
    16. Surfing. the crest of a wave.
    17. Ice Hockey. an act or instance of hooking.
    18. a line at the end of the stem of certain musical notes; flag. The eighth note has one.
    –v.t.
    1. to fasten or attach with or as if with a hook or hooks. &#187;
    Will you hook my dress for me?

    2. to catch or take hold of with a hook. &#187;
    The farmer hooked each blade of hay and threw it on the wagon.

    3. to join or fit like a hook.
    4. to catch (fish) with a hook. &#187;
    We hooked a trout and had it for breakfast.

    5. Figurative. to catch by a trick, as a husband. &#187;
    The first woman who fishes for him, hooks him (Thackeray).

    6. Informal. to steal; pilfer. &#187;
    to hook the money and hide it (Mark Twain).

    7. to give the form of a hook to.
    8. to throw or hit (a baseball) so that it curves.
    9. to hit (a golf ball) so that it curves widely to the left.
    10. to pull (the ball) in cricket.
    11. Rugby. to push (the ball) back with the foot to a teammate out of the center of scrummage.
    12. Boxing. to hit (an opponent) with a short, swinging blow.
    13. U.S. to make (a rug, pillow cover, or other article) by pulling loops of yarn or strips of cloth through canvas, burlap, or other loosely woven material, with a hook.
    14. to catch on the horns; attack with the horns, as a cow or bull does.
    15. Ice Hockey. to hinder illegally the advance of (a puck carrier) by catching at his body from the side or rear with one's stick.
    –v.i.
    1. to be fastened with or as if with a hook. &#187;
    The gate hooked shut with a click as he left the garden.

    2. to be curved or bent like a hook.
    3. to bend or curve like a hook. &#187;
    At this point the river hooks around to the north.

    4. to move suddenly. &#187;
    always hooking about on mysterious voyages. (Washington Irving)


    该用户从未签到

    59

    主题

    960

    回帖

    8774

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    8774

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    19
    发表于 2015-10-30 11:56:06 | 只看该作者
    Oeasy 发表于 2015-10-30 09:34
    这里有个疑似从 World Book&#174; Dictionary, 2 volumes(Eng-Eng) http://lingvodics.com/dics/deta ...

    http://useful_english.enacademic.com/65659/hook#sel=512:1,512:1
    这网站有意思,里面的排版看着面熟,像是论坛某位人士的习作

    http://lingvodics.com/dics/details/3809/
    这个是之前最老的那个2005版?带插图麽?

    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    20
     楼主| 发表于 2015-10-30 12:02:50 | 只看该作者
    本帖最后由 Oeasy 于 2015-10-30 12:07 编辑



    来自 http://forum.ru-board.com/topic. ... 20&start=2340#4
    是  21:54 24-05-2012 发布介绍的,看 Source:: <<Home | World Book Advanced>> http://forum.ru-board.com/topic. ... p;limit=1&m=2#1 ),也是从在线网站抓的,可能那个时候,网站还能查到 hook ,不过这 dsl 版本并未公开分享过,我山寨过这排版。

    http://forum.ru-board.com/topic. ... p;limit=1&m=5#1
    原 dsl 作者发布的截图:


    我山寨的排版:





    该用户从未签到

    59

    主题

    960

    回帖

    8774

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    8774

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    21
    发表于 2015-11-1 13:16:41 | 只看该作者
    本帖最后由 bt4baidu 于 2015-11-1 13:18 编辑

    无图无真相
    ap-
    &assocpress;

    asterism
    &upstar;
    &downstar;

    chevron
    &chevron1;
    &chevron2;

    coincide
    &utri; &utri;

    formula
    &chemform;

    i
    &sqrt& #173;1

    index
    &cbrt764;

    lazy
    &lazyJ;

    radical sign
    &cbrt27;

    该用户从未签到

    1

    主题

    152

    回帖

    553

    积分

    举人

    Rank: 4

    积分
    553

    灌水大神章小蜜蜂章笑傲江湖章

    22
    发表于 2015-11-4 12:46:18 | 只看该作者
    本帖最后由 css 于 2015-11-29 17:05 编辑
    来自 http://forum.ru-board.com/topic. ... 20&start=2340#43 e/ E) F& Y/ G" p. r& l
    是  21:54 24-05-2012 发布介绍的,看 Source:: <<Home | World Book Advanced>> (http://forum.ru-board.com/topic. ... p;limit=1&m=2#1 ),也是从在线网站抓的,可能那个时候,网站还能查到 hook ,

    O版火眼金睛。 版式确实一样。理由有二:
    一、POED 2002到CALD4, 似乎原作者的版式一致性很强。
    二、原作者贴图的短语效果与这个网站看到的(内置)方式也完全一致: 都是标准的dsl内词条规则。(网站大约是忽视了这点, 将dsl内置词条的标记一并上线了。)
    顺便说一句, 推测这个网站在线的版本可能只是dsl的初版, 理由有二:
    一、同一原作者对CALD4(较后的作品)的短语处理似乎发生了很大变化, 当然可能只是情形不同而已。 就短语而言, 内词条方式自然标准而惬意, 但却也有些具体局限。
    二、 这个版本的短语处理似乎还是有点缺憾, 即: 短语词条化作为索引后,其文字内容似乎不应从原文中消失, 而只留下解释例句等。原作者后期的作品似乎没这问题。

    再有:
    对照查了几个版友上述所列缺词:
    一、网站内容还基本都有。
    ....也是从在线网站抓的,可能那个时候,网站还能查到 hook.....

    二、这些词似乎缺词源部分, 这有违在线版体例, 由此推测,其来源怕不是在线网站本身。