查看: 1181|回复: 6
打印 上一主题 下一主题

[讨论] 建议:不要在生成字典时繁简统一

[复制链接]

该用户从未签到

1

主题

14

回帖

105

积分

被盗用户

积分
105
跳转到指定楼层
1
发表于 2012-3-12 22:57:49 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
维基百科新版本的字典编译软件似乎支持繁简统一化,乍看起来没啥不好,但是忽略了一个问题:
维基百科的mediawiki是将繁体和简体标题认为是两个主题的,比如说“台湾”和“臺灣”是对应两个页面的。
虽然说一般情况下这二者其中一个只是重定向页面,也就是指引用户访问另一个版本的页面。

但是:
有一些页面中,简繁体的主题都是有内容的,而且内容不同。

比如:
“汉化”和“漢化”就是都有内容的,而且内容不同。

如果在生成词库的时候直接繁简统一,必然会有一个页面的内容被去掉。

因此建议选择替代方法:如果用户想查繁体的词条,先在mdict中选择“转换为简体”,然后再输入简体的词条名,mdict将自动使用繁体来查询词条。【正好倒过来,原因不明】

该用户从未签到

1

主题

14

回帖

105

积分

被盗用户

积分
105
2
 楼主| 发表于 2012-3-12 23:50:28 | 只看该作者
之前我就有提到过这一点,但是当时一下子想不起来哪个词条是如此的,今天找到例子了,就上来正式发帖说一句~

该用户从未签到

1

主题

14

回帖

105

积分

被盗用户

积分
105
3
 楼主| 发表于 2012-3-27 09:56:16 | 只看该作者
维基百科中:
汉化:http://zh.wikipedia.org/wiki/%E6%B1%89%E5%8C%96 是带有一定资料的消歧义页面
漢化:http://zh.wikipedia.org/wiki/%E6%BC%A2%E5%8C%96 是一个完整的内容页面

该用户从未签到

13

主题

454

回帖

3027

积分

贡士

Rank: 6Rank: 6

积分
3027

灌水大神章

4
发表于 2012-3-27 20:04:23 | 只看该作者
第二次看到汉化问题了, 刚去wiki改了

该用户从未签到

13

主题

454

回帖

3027

积分

贡士

Rank: 6Rank: 6

积分
3027

灌水大神章

5
发表于 2012-3-27 20:06:13 | 只看该作者
台湾被人修正了

该用户从未签到

131

主题

535

回帖

2826

积分

解元

Rank: 5Rank: 5

积分
2826

笑傲江湖章灌水大神章

6
发表于 2012-3-28 10:03:40 | 只看该作者
刚才查了一下维基百科的201203版本,汉化这个词条有2个,一个是汉化(消岐义),一个是汉化(2),与维基上显示一致,内容没有损失。
为何不建议用MDICT的简繁转换,因为MDICT简繁转换系统的排序机制尚有瑕疵,可能会造成部分词条排序后丢失。

该用户从未签到

131

主题

535

回帖

2826

积分

解元

Rank: 5Rank: 5

积分
2826

笑傲江湖章灌水大神章

7
发表于 2012-3-29 21:10:13 | 只看该作者
例如维基语录在转换为简体状态时,查找爱迪生、爱因斯坦,都显示无此词条。