|
本帖最后由 cdyg 于 2011-4-18 18:34 编辑
诸位兄弟,前两天刚发现制作的辞典在采用UE正则表达式对超级链接解析转换过程中造成了部分内容丢失,现采用UNIX风格的正则表达式重新解析转链,生成的新辞典大小为532M(545,181K),比原来大了49M,现已确认文件增加的尺寸就是原来丢失的内容。
目前辞典已重新上传,对各位朋友造成的不便,敬请谅解!
更新内容:
一、将百科全书的《参考目录列表》提到相对较前面的位置,更方便检索;
二、修正了外链呈现的方式,统一用“外链”二字进行标识,同时也更为简洁且压缩了文件大小。
三、增补了维基简繁转换修正库的几个特例定义项。
新下载地址:http://u.115.com/file/f5ea286311
一、
文件大小:532M
版本日期:2011.4.6
词条数: 550833 条
使用平台:PPC /PC/ IPHONE(IPAD)
Generated by version: 2.0
Required mdx engine version: 2.0
Encoding: UTF-8
Dict format: Html
Key case sensitive: No
Strip key: Yes
Compact format: No
Allow export to txt: Yes
DB Unique ID: 7fc03a93b904084f
Total entries: 550833
二、采用xml2txt2.0引擎,公式、符号完美呈现;
2.0与2.1引擎分别是指zj851210与minirain两位作者独立制作的两个xml2mdx/xml2txt引擎程序,二者没有继承与代码优化的关系,其表现各有千秋。
从美观上,我个人认为2.0要优于2.1,显示图表与公式效果都要更好,而显示速度是2.1高于2.0。
因此,不要认为2.1版本号更高,不必迷信数字,相信自己的眼睛吧!
三、词条只有55万,是因为这个版本的维基百科已全部转换为大陆简体,删除了重复繁体(链接)词条。
未转换为简体版本之间,大部分繁体词条同时也有简体词条链接,但部分词条仅有繁体词条,如“张志忠”、“张士诚”等词条,以往先用简体输入法查,查不到再切换到繁体输入法查找,这样非常麻烦。
现通过维基的简繁转换系统进行修正处理后,将所有词条全部转换成大陆简体(习惯)且仅保留唯一词条。
四、修正了以往维基诸引擎制作版本中新加坡词条内容不完整的问题(经分析这个问题是由源XML文件引入的,自2008年始诸版本都存在)。
五、将词条内部的链接都转换为外网链接,可以通过手机默认浏览器(PIE或UCWEB等)直接打开引用的链接。
六、对部分冗余信息进行处理与翻译以获得更好的阅读体验。
2.0引擎对冗余信息处理不是太好,但如果将词条的提示关键信息全部过虑删除,例如有些归纳性的、一般性、规范描述,例如人物、国家、术语及各分类词汇,如人物的生辰籍贯、城市的人口面积等,这些信息都被作为“冗余”信息给过滤了反而影响了词条的完整性,影响了对词条的理解与掌握,我个人认为应当尽量予以保留,但可对英文提示信息进行适当翻译以便于理解,这部辞典仅是初步的尝试,可能还远谈不上完美,今后将进一步予以完善。
比较见下图:
|
|