|
本帖最后由 viarm 于 2012-5-23 11:14 编辑
这是排名第三的专业四大词源字典(Origins)的一部分. TXT from PDF. 这样的字典格式看起来简单, 但隐含了许多危险. 要把这样的字典做到能用的地步, 比一般字典要难得多. 通常的特殊字符(主要是印欧语非现代英语的其他语言的字符与符号, 及其对应的历史字符与符号)就在200以上, 需要验证, 必要的时候还需要参考其他字典, 对图形的特殊字符Unicode化. 字典正文缩写化/符号化严重, Abbrv至少数以百计, 有的甚至上千, 这也需要特殊小心处理, 否则新手是根本无法愉快阅读的. Lingoes/MDX都有一两部词源字典, 质量都太差. 词源本来就是求真索源, 谁敢用不靠谱的? 那会走火入魔. 这种字典很小众, 需求也很个性化.
Lingvo格式的这本书去年我就做了, 不过至今还在不断验证中. 这种类型的字典只能边做, 边用, 边多方对照修订. 这本书的数据源还是可靠的(但绝非是为程序化电子字典准备的数据), 自然还是有地方是明显错误的. 另外, PDF格式中也有格式错误的地方, 需要小心对待. |
|