查看: 1810|回复: 3
打印 上一主题 下一主题

[汉汉] 《通用规范汉字表》居然没有官方文字版?

[复制链接]

该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

跳转到指定楼层
1
发表于 2018-2-11 11:44:36 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 Oeasy 于 2018-2-11 16:18 编辑


缘起:
- 《新华字典》(第11版)是否包含了《通用规范汉字表》的全部汉字 https://www.zhihu.com/question/266697638/answer/316548156

---

国务院关于公布《通用规范汉字表》的通知
国发〔2013〕23号 http://www.gov.cn/zwgk/2013-08/19/content_2469793.htm

有个 95.9 MB PDF :
- http://www.gov.cn/gzdt/att/att/site1/20130819/tygfhzb.pdf
- http://www.moe.gov.cn/s78/A19/yx ... 0130601_186002.html

这里有个 2009 年的征求意见稿 PDF http://www.china-language.gov.cn/doc/zb2009.pdf ,可复制,但是比较 tricky ,复制出来是乱码。

按说这种,应该有个专门站点、页面,给出里面所有字的文字版。我花了半小时,愣是没有找到一个可靠的列表。

倒是有一些:
- 通用规范汉字表.xls https://github.com/bedlate/cn-co ... %AD%97%E8%A1%A8.xls
    - ->mdx https://www.pdawiki.com/forum/thread-23135-1-1.html
- 2013通用规范汉字表(DOC版) http://xh.5156edu.com/page/z6211m4474j19255.html {有 [艹+为]、[石+肯] 、[土+翏] 这种}
- 通用規範漢字表.txt https://github.com/rime-aca/char ... %AD%97%E8%A1%A8.txt

这些看上去是网友整理的,整理得很辛苦,但是和原版相比,可信度、完整度、准确度差了些。

参考:
- 教育部语言文字信息管理司组 http://www.moe.gov.cn/s78/A19/yxs_left/moe_810/
- https://zh.wikipedia.org/wiki/%E ... 9%E5%AD%97%E8%A1%A8
- 全国哲学社会科学规划办公室>>2014年重大项目>>《通用规范汉字表》8105字形音义源流研究>>基本信息 http://www.npopss-cn.gov.cn/n/2015/0205/c393296-26514702.html

---

同样的情况:
- [英汉-汉英] 公共服务领域英文译写规范[2017年12月1日实施] 文字版? https://pdawiki.com/forum/thread-22263-1-1.html
目前倒是有网友自行整理出了文字版。


该用户从未签到

129

主题

517

回帖

1万

积分

状元

Rank: 9Rank: 9Rank: 9

积分
13037

灌水大神章小蜜蜂章笑傲江湖章

2
发表于 2018-2-11 12:27:59 | 只看该作者
本帖最后由 ucccafe 于 2018-2-11 12:49 编辑

http://www.gov.cn/gzdt/att/att/site1/20130819/tygfhzb.pdf
裡面的8105的字就把一級3500個字、二級3000個字以及三級1605個字
以編號方式排列出來,可自行把PDF改為其他的文字檔或圖片檔。
日本小學館的日中/中日第3版辞典也是依照此PDF編輯的。
(2013年に中国で公布された「通用規範漢字表」の全漢字を収録しています。)
沒再列出簡單的文字檔或網頁版,原因可能跟LDOCE6那近9000個常用字類似。
不過LDOCE6官方回覆我的理由是怕辭典賣不好,國 務 院的理由可能是怕不同設備出現的亂碼吧。

该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

3
 楼主| 发表于 2018-2-11 12:34:10 | 只看该作者
本帖最后由 Oeasy 于 2018-2-11 12:37 编辑
ucccafe 发表于 2018-2-11 12:27
http://www.gov.cn/gzdt/att/att/site1/20130819/tygfhzb.pdf
裡面的8105的字就把一級3500個字、二級3000 ...



非文字版 PDF 转文字,要做到 100% ,太难了,尤其还涉及到生僻汉字。

我理想中的类似下面网页:
- Oxford 3000™ https://www.oxfordlearnersdictio ... english/oxford3000/
- The Longman Defining Vocabulary http://www.pu-kumamoto.ac.jp/~rlavin/resources/wordlists/LDV.html

而不是:
- https://www.lextutor.ca/freq/lists_download/longman_3000_list.pdf

这么多年了,居然没有一个可靠的、美观的、可查询的网页版,真是不可思议。




  • TA的每日心情
    开心
    2023-1-25 18:05
  • 签到天数: 203 天

    [LV.7]常住居民III

    5

    主题

    186

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    20426
    4
    发表于 2018-2-15 08:42:11 | 只看该作者
    ucccafe 发表于 2018-2-11 12:27
    http://www.gov.cn/gzdt/att/att/site1/20130819/tygfhzb.pdf
    裡面的8105的字就把一級3500個字、二級3000 ...

    == 那国务院好歹也应该用他原版的文档直接转换成图像PDF吧……结果弄了个扫描版,还扫歪了!