查看: 1789|回复: 9
打印 上一主题 下一主题

[词典讨论] 推荐大型古汉语字典词典辞典使用中华书局宋体字库

[复制链接]
  • TA的每日心情
    开心
    2022-1-21 00:52
  • 签到天数: 699 天

    [LV.9]以坛为家II

    17

    主题

    1754

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    19738
    跳转到指定楼层
    1
    发表于 2019-12-3 15:04:37 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 cocowind 于 2019-12-3 15:08 编辑

    http://www.ancientbooks.cn/helpcore?font

    中华书局宋体字库是中华书局古联公司为满足古籍和文史哲学术论著数字化建设的需要,委托北大方正公司制作的字库。


    基本情况


            字库由“中华书局宋体00平面”、“中华书局宋体02平面”和“中华书局宋体15平面”三个ttf字体文件组成,收字已超过13万。其中“中华书局宋体00平面”、“中华书局宋体02平面”字体中的字符授权自“方正宋体超大字符集”,支持基本通用字符及所有CJK汉字;“中华书局宋体15平面”为古联公司委托方正公司制作的专用字符集,收录Unicode未定义的楷书汉字、古文及古代文化符号。

    字库特色


            1. 字体收录的汉字多,不仅涵盖了Unicode12.0的所有已定义CJK汉字,还有超过2万制作时Unicode未定义的出自古籍的汉字字符,而且随着古籍数字化工作的进行,汉字字符还会增加。

            2. 字体覆盖范围广,不仅有宋体风格的楷书汉字,还有全部说文小篆、卦象符号、算筹数字、注音字母、国际音标符号等,也包含了大部分的拉丁文、日文、希腊文等外文字符。

            3. 字库建设过程中,以Unicode发布的字符集为标准。汉字部分尽量快速响应Unicode关于CJK字符集的更新,专用区造字通过多属性标注、多属性查重,尽量避免产生重复造字;其他区块的字符则视数字化工作的需要,陆续添加。

    说明:

    1. Unicode中的兼容区一般被视为未定义、非标准、被废弃的区块。如中日韩兼容表意文字区(CJK Compatibility Ideographs),编码范围为F900–FAFF,这一部分的字符一般在CJK汉字中被定义,无需重复收录。

    2. 扩展注音符号、中日韩笔划、中日韩兼容、中日韩标点符号和带圈或括弧中日韩字母及月份这几个与中文相关的区块的字符,在古籍和文史哲学术论著数字化中利用率较低,暂未整批收录。

    字形示例





  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

    307

    主题

    854

    回帖

    3万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    34117

    QQ 章

    推荐
    发表于 2019-12-3 17:29:43 | 只看该作者
    999阿彌陀佛 发表于 2019-12-3 16:52
    樓主最好先下載試用後,直接以附件或網盤提供。方便大家使用。

    我已经下好了。

    链接: https://pan.baidu.com/s/13SEu_NcGi4YjIWBBsYek9Q 提取码: 9jhj
  • TA的每日心情
    开心
    2022-1-21 00:52
  • 签到天数: 699 天

    [LV.9]以坛为家II

    17

    主题

    1754

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    19738
    2
     楼主| 发表于 2019-12-3 15:11:58 | 只看该作者
    本帖最后由 cocowind 于 2019-12-3 16:27 编辑

    还有专门输入法
    http://www.ancientbooks.cn/helpcore?input
    中华书局古联输入法安装和使用说明

    使用输入法之前,需先下载安装中华书局宋体字库。使用方法见
    http://abcircle.ancientbooks.cn/abcircle/article/detail/201

    该用户从未签到

    539

    主题

    3046

    回帖

    25万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    251288

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    3
    发表于 2019-12-3 16:02:05 | 只看该作者
    非Unicode方案

    即便用了,在别的地方也无法兼容

    除非所有人都装中华书局的这个

    而中华书局的这个要中国大陆的手机号/身分证才能下载

    所以……
  • TA的每日心情
    开心
    2022-1-21 00:52
  • 签到天数: 699 天

    [LV.9]以坛为家II

    17

    主题

    1754

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    19738
    4
     楼主| 发表于 2019-12-3 16:26:19 | 只看该作者
    klwo2 发表于 2019-12-3 16:02
    非Unicode方案

    即便用了,在别的地方也无法兼容

    是的。需要一个统一的字库,不然同一个字在不同字库里编码不一(甚至有的字库一个字多个编码)。

    目前没有官方机构愿意干这种基础工作,那尽可能多的人从中华书局这个字库起步则不失为不得已的办法。

    以后若能逐步演变成一个标准就更好了,比如编码沿用此字库、而字形为开源制作

    该用户从未签到

    539

    主题

    3046

    回帖

    25万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    251288

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    5
    发表于 2019-12-3 16:41:39 | 只看该作者
    cocowind 发表于 2019-12-3 16:26
    是的。需要一个统一的字库,不然同一个字在不同字库里编码不一(甚至有的字库一个字多个编码)。

    目前没 ...

    多的是人没有中国大陆的手机号/身分证

    所以这事儿还是省省吧
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

    307

    主题

    854

    回帖

    3万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    34117

    QQ 章

    6
    发表于 2019-12-3 16:52:55 | 只看该作者
    cocowind 发表于 2019-12-3 15:11
    还有专门输入法
    http://www.ancientbooks.cn/helpcore?input
    中华书局古联输入法安装和使用说明

    樓主最好先下載試用後,直接以附件或網盤提供。方便大家使用。
  • TA的每日心情
    擦汗
    昨天 07:00
  • 签到天数: 1090 天

    [LV.10]以坛为家III

    124

    主题

    1772

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10477

    灌水大神章小蜜蜂章笑傲江湖章

    8
    发表于 2019-12-3 21:03:19 | 只看该作者
    klwo2 发表于 2019-12-3 16:41
    多的是人没有中国大陆的手机号/身分证

    所以这事儿还是省省吧

    台湾倒是很大方,很多词典都公开共享。大陆太小气,连国图古籍都要身份证号码。考虑到可扩充文化影响,应该大大方方共享给任何人。
  • TA的每日心情
    开心
    2019-1-18 23:55
  • 签到天数: 230 天

    [LV.7]常住居民III

    72

    主题

    1027

    回帖

    11万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    117972

    QQ 章

    9
    发表于 2019-12-4 09:48:15 | 只看该作者
    麻烦主要在两个:兼容区字形;unicode未收录字形。
    不过,我觉得这个问题其实不算太大。到扩展B区就几乎把《汉语大字典》里的字收录完了,漏网之鱼似乎不过十来个。
    现版本的《汉语大词典》电子版更没问题了,因为当初电子化时就是按GBK收录的,超出范围的字头和例证扔掉。。而且实际上到扩展B区漏网之鱼也只剩二十个左右。
    台湾那位大神做的汉语词典用的是他自己搜罗制作的字体,值得注意的就是收录了兼容区里不同的字形。另外自造字自然和别的字体不通用,不过他也在词典里标注了。