|
bt4baidu 发表于 2014-8-15 12:02
WBD2011缺以下单词:
apothecaries' measure
apothecaries' weight
拼写谬误极多!该词典编辑极不负责,以下HTML实体代码都是瞎写杜撰,令人瞠目,一部分根据旧版和上下文可以订正:- text=text.replace(' <BR>', ' <BR>')
- text=text.replace('&upstar; or &downstar;', '\xe2\x81\x82')
- text=text.replace('ˇ', '\xcb\x87')
- text=text.replace('&Ggr;', '\xCE\x93')
- text=text.replace('&KHgr;', 'Χ')
- text=text.replace('&khgr;', 'χ')
- text=text.replace('&Rgr;', 'ρ')
- text=text.replace('&Igr;', 'ι')
- text=text.replace('&Sgr;', 'σ')
- text=text.replace('&Tgr;', 'τ')
- text=text.replace('&Ogr;', 'ο')
- text=text.replace('✓', '\xe2\x9c\x93')
- text=text.replace('&chevron1;', '^')
- text=text.replace('&chevron2;', '\xef\xb8\xbd')
- text=text.replace('&conjunction;', '∧')
- text=text.replace('&sqrt­1;', '√-1')
- text=text.replace('⊔', '\xe2\x8a\x94')
- text=text.replace('♭', '\xe2\x99\xad')
- text=text.replace('…', '\xe2\x80\xa6')
- text=text.replace('''<a href="javascript:showEntry('gender[&etydf;Old French ', 'ent_052676')" target="_top"><B>gender[< Old French </B>.</a>]''',
- '''<a href="javascript:showEntry('gender', 'ent_052676')" target="_top"><B>gender</B>.</a>[< Old French]''')
- text=text.replace('&Dgr;', 'Δ')
- text=text.replace('&dgr;', 'δ')
- text=text.replace('&ugr;', 'υ')
- text=text.replace('&assocpress;', '<span style="letter-spacing:-2px"><i>A</i>P</span>')
- text=text.replace(' or &chemform;', '')
- text=text.replace('&lazyJ;', '<img src="lazyJ.png">')
- text=text.replace('‴', '\'\'\'')
- text=text.replace('&pgr;', 'π')
- text=text.replace('&agr;', 'α')
- text=text.replace('&bgr;', 'β')
- text=text.replace('&rgr;', 'ρ')
- text=text.replace('&xgr;', 'ξ')
- text=text.replace('&sfgr', 'σ')
- text=text.replace('‐', '\xe2\x80\x94')
- text=text.replace('□','X')
- text=text.replace('○','O')
- text=text.replace('&cbrt764;','\xe2\x88\x9b764')
- text=text.replace('&cbrt27;','\xe2\x88\x9b27')
- text=text.replace('&fracacbc;','AC / BC')
- text=text.replace('&fracabbc;','AB / BC')
- text=text.replace('&phgr;','φ')
- text=text.replace('▵','▵')
- text=text.replace('℞', 'Rx')
- text=text.replace('”', '”')
- p = re.compile(r'(?<=\w)|(?=\w)')
- text = p.sub(r'', text)
- text=text.replace('&schwa;', '\xc9\x99')
复制代码 尚有几处不知其具体意义,或无对应文字,无法订正:- &fraction1;#mathematic
- &fraction2;#mathematic
- &fraction3;#mathematic
- &shortsyllable;# Greek syllable
- &pause;# Greek syllable
- &circlestangent;#mathematic
复制代码 |
|