|
本帖最后由 lwangls 于 2015-2-16 18:53 编辑
德国人工成本太高了。两个小组,几十名打字员, 两年时间,100万欧元的预算哪够啊。
---------------------------------------------------
——德国之声
词汇最全面的德语词典“格林词典”以前只是以书的形式存在,但现在人们仅需一张光盘就能看到331056条词汇的解释。特里尔大学耗资100万欧元,历时两年完成了这套词典电子版的出版。有意思的是,这个电子格林词典是在中国制作的。
对于光盘如何容得下300万字的问题,布尔赫博士做了解释,他负责领导特里尔大学的"文科读物电子开发和出版技术中心。
布尔赫博士说:"我们以词典的内容为基础,和一家中国研究机构合作,我们把文字和书给他们传送过去,中国的研究机构有两个互不干扰的小组,它们分别用手工把词典的内容输入电脑,也就是说,两组人员同时输入,互不影响。这样就会产生同一文字的两种版本。
输入是一行一行进行的,这样就保持了词典印刷和排版的外貌。这项工作在中国开展,是因为中国人对文字有一种特殊的敏感。况且中国人对格林这个名字并不陌生,几乎所有的孩子都知道格林童话。格林词典的电子版在中国出版,并且成为廉价的家庭必备手册,这听起来本身就象格林词典漫长历史里的一段插曲。
格林词典首创于1868年,不久后格林兄弟就应付不了词典的工作,1961年也就是差不多100年后,这部词典的最后一册才出版。每一册词典都包括从1450年到各自出版时的德语词汇。这套词典共有4个不同阶段,是一部不统一的著作,是词汇的采石场。开发这部词典对陶京宁博士来说并不只是机械的输入,它还是深受欢迎的学习知识的过程。
尽管这样,电子版当然还是有错误和不清楚的地方,特里尔大学对照两个不同的版本,并且按照书稿修改错误。最后每10页才出现3个错误。当所有的内容都输入电脑后,数据库的整理工作就开始了。
只有经过这项工作,这部词典才能被用于解答不同问题的研究工作,比如说-出自希特勒的引言有多少条?出自妇女的引言有多少?词典的单独部分被标出。负责这部分工作的是特里尔大学的"数据加工语言学者巴尔茨,他的工作颇为棘手,因为同一名称往往有不同的写法。
"最著名的例子就是歌德的名字,写法有两种,更惊人的是阿布.海姆的名字,这部词典里就有30种写法。
目前特里尔大学把这项成果制成光盘提供人们使用。每个人都可以检验一下这项德中合作是否值得,因特网上每人都能免费使用格林词典的电子版。
|
|