查看: 411|回复: 1
打印 上一主题 下一主题

[求助] 汉字编码问题

[复制链接]
  • TA的每日心情
    开心
    2019-5-28 07:39
  • 签到天数: 339 天

    [LV.8]以坛为家I

    87

    主题

    558

    回帖

    4万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    42284
    跳转到指定楼层
    1
    发表于 2019-1-27 20:31:03 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 leescott 于 2019-1-27 20:32 编辑

    有些汉字在utf-8显示为

    这个不知道怎么批量转换为汉字。

    一般的,在mdx中,这种汉字又能正确显示的可能性大吗?

    谢谢!

    该用户从未签到

    9

    主题

    228

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11443
    2
    发表于 2019-1-27 22:39:24 | 只看该作者
    在Unicode中,私人使用区(简称:私用区;英语:Private Use Areas,简称:PUA)指其解释未在Unicode标准中指定,而是由合作用户之间的私人协议决定其用途的一系列码位。[4] 当前定义了三个私人使用区:一个在基本多语言平面(U+E000-U+F8FF)中,另外两个几乎包含了整个第15和第16平面(分别为U+F0000-U+FFFFD,U+100000-U+10FFFD)。[5]

    私人使用区字符的分配,可不由字面意义上的私人决定;一些组织已经发布了一些分配计划。但根据其定义,私人使用区相同的代码点可被分配为不同的字符,因此用户可能因安装了某种字体,看到其显示为一种形态,但使用了其他字体的用户可能看到完全不同的字符。
    以上摘自「喂鸡百科」。

    从字符编码看,属于私人使用区字符,所以正常情况是显示不出来的,除非安装了含有这些私人字符的字体。

    评分

    2

    查看全部评分