查看: 1506|回复: 4
打印 上一主题 下一主题

[讨论] [脑洞] 快速做一些汉语字典mdict版的一个想法

[复制链接]

该用户从未签到

539

主题

3046

回帖

25万

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
251476

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

跳转到指定楼层
1
发表于 2015-10-21 00:08:20 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 klwo2 于 2015-10-21 14:52 编辑

众所周知,甭管什么平台,汉语类的词典都是少之又少,而且我自己用的,大部分也都是集中在那几位大神的作品。

如果没有文本,汉语词典做图片版最快,做图片版又要找字、输入词条,实在比不上拉丁字母世界的效率,咳咳……

所以有如下脑洞:

1. 网上已经有了CJK 汉字读音表:http://haoma.sogou.com/bbs/forum ... ead&tid=2566343 虽然不是最新的Unicode,不过够用了
2. 做一个汉字-读音对应词典(我好想管这个词典叫“隐藏门”),比如 好 hao3 hao4,分别链接到PinYinHao3,PinYinHao4
3. 大部分大陆出版的字典都是汉语拼音排列的,每个拼音下字头怎么排列也大致一致。利用做图片版词典的经验,让比如PinYinHao3对应到某本字典hao3这个音的第一页,然后翻页就是PinYinHao3.2,PinYinHao3.3,PinYinHao3.4……
4. 如果多本词典都是按这个规则做的,就可以有:输入PinYinCi2,出现多本词典音节ci2,按下“下一页”的时候,多本词典同时翻页。多音字越少的音节,对应越是一致。多音字多的时候,可以特殊处理(比如yi)


有不少汉语词典你说鸡肋吧也没有多鸡肋,一个字一个字做吧又似乎不值得花那个精力。我觉得这是一个不错的中间路子

不过这个脑洞没有解决词典里面的多音节词怎么检索的问题,而且如果字典(只有字)和词典都用这个规则,同一个字,字典会在词典前面几页,没想出更好的办法,所以发上来大家看看,咳咳

该用户从未签到

539

主题

3046

回帖

25万

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
251476

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

2
 楼主| 发表于 2015-10-21 14:20:30 | 只看该作者
本帖最后由 klwo2 于 2015-10-21 14:53 编辑

說做就做,隱藏門mdx 已經做好




隐藏门.zip (634.69 KB, 下载次数: 25)

你也可以叫它別的,反正本質是一個漢字-unicode讀音對應表,帶鏈接。

數據來自wangyanhan的【CJK汉字拼音表_42907字_14.8.10更新】,大部分時候夠用,不排除有的詞典有不一樣的讀音(比如早期詞典淚標lui4,戀標lvan4,現代漢語詞典哼標hng等等)

该用户从未签到

110

主题

685

回帖

2万

积分

状元

Rank: 9Rank: 9Rank: 9

积分
23333

灌水大神章小蜜蜂章笑傲江湖章

3
发表于 2016-1-1 11:51:33 | 只看该作者
谢谢,下次做中文辞典时,我会把”隱藏門“加在辞典中,作为拼音查询。
最好是改为:
<b>&#13313;</b><BR><BR>[<a href="entry://tian4">tiàn</a>]
Unihan數據辭典 也是用这种格式, 查tian4, 出:
[拼音·注音] tian4 ㄊㄧㄢˋ
&#13313;&#13431;&#14833;&#15239;&#15802;掭栝添煔瑱舚蚦蚺


汉语词典中的图片词头可以用这种方法查询。

该用户从未签到

539

主题

3046

回帖

25万

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
251476

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

4
 楼主| 发表于 2016-1-2 09:43:09 | 只看该作者
Langheping 发表于 2016-1-1 11:51
谢谢,下次做中文辞典时,我会把”隱藏門“加在辞典中,作为拼音查询。
最好是改为:
&#13313;[tiàn]
...

多謝支持!