本帖最后由 流星冲击 于 2019-2-23 21:16 编辑
Microsoft Encarta English Dictionary数据提取自Encarta2009的Encarta Dictionaries,源格式是xml。 先要感谢tsiank提供wordlist,以便补全提取时缺少的headwords。 特别要感谢的是整理数据和排版的那位朋友,排版风格如以往一样朴素。 mdx制作特点: 1, 合并相同词条 2,音标字体以base64形式内嵌在css中,无需单独安装 3, 光盘版的词条内容后面的usage、dialect等部分以空行分隔但没有标注条目,还有就是光盘版这部分的例句有标签嵌套但没为其排版,遂后期对其添加usage、dialect等标注条目和例句排版 4,链接带锚跳,可以直达对应词头、义项 5,还有很多小标签 ,地域国家详情标签:语言、首都、人口、面积等和华氏度、摄氏度符号都排版了,xslt的规则没有对这些进行处理 词典内容特点: 内容根据bloomsbury的语料库以释出,解释部分采用双重释义,粗体部分是精炼解释,后者对其补充解释,辅之以例句点睛,若不能一眼道破精炼解释,仍还有补充解释以明定,确是ESL学习之典范。 词典截图:
|