查看: 1106|回复: 0
打印 上一主题 下一主题

[筹划] 《朗文多功能分类词典》3步之文本化:(报名2016.6.30截止)

[复制链接]

该用户从未签到

2

主题

60

回帖

338

积分

秀才

Rank: 3Rank: 3

积分
338
跳转到指定楼层
1
发表于 2016-4-24 12:05:04 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 dashuchong 于 2016-4-24 12:06 编辑

1,现为《朗文多功能分类词典》文本化找合作伙伴,全文共1300页左右
现在网上下载的PDF格式的不是很清晰,用ABBYY OCR识别的成功率不是很高,识别准确率大概百分之五六十吧,因此需要大量的人工校对输入,如有想参与并做事认真的请踊跃报名(如做事一贯马虎的敬请不要参加,因为这反而可能造成更大的麻烦),报名截止时间为2016.6月.项目预期完成时间为1-3个月。希望有不少学生能利用暑假时间来参与这个项目。
希望能有20-50人参加,多多益善。报名截止时如有不少于10人参与,我会给出OCR识别后的文本,如无特殊情况和要求,校对输入的工作量按人数平均分配。如果有人愿提供这个绝版书的原版高清扫描PDF就更好了。
成功后参与者每人得到校对好的词典文本一份。
下面是后续工作设想:

2,有了这个文本,会进行下一步MDICT词典(图文版)制作

3,为词典制作单词与例句朗读的音频,做成MDICT词典(图文带语音版)