|
本帖最后由 dashuchong 于 2016-4-24 12:06 编辑
1,现为《朗文多功能分类词典》文本化找合作伙伴,全文共1300页左右
现在网上下载的PDF格式的不是很清晰,用ABBYY OCR识别的成功率不是很高,识别准确率大概百分之五六十吧,因此需要大量的人工校对输入,如有想参与并做事认真的请踊跃报名(如做事一贯马虎的敬请不要参加,因为这反而可能造成更大的麻烦),报名截止时间为2016.6月.项目预期完成时间为1-3个月。希望有不少学生能利用暑假时间来参与这个项目。
希望能有20-50人参加,多多益善。报名截止时如有不少于10人参与,我会给出OCR识别后的文本,如无特殊情况和要求,校对输入的工作量按人数平均分配。如果有人愿提供这个绝版书的原版高清扫描PDF就更好了。
成功后参与者每人得到校对好的词典文本一份。
下面是后续工作设想:
2,有了这个文本,会进行下一步MDICT词典(图文版)制作
3,为词典制作单词与例句朗读的音频,做成MDICT词典(图文带语音版) |
|