查看: 299|回复: 11
打印 上一主题 下一主题

[求助] 请教怎样写正则代码才能用配特殊的汉字?

[复制链接]
  • TA的每日心情
    无聊
    2023-2-17 11:35
  • 签到天数: 284 天

    [LV.8]以坛为家I

    20

    主题

    889

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10318

    QQ 章

    跳转到指定楼层
    1
    发表于 2020-11-14 09:08:31 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
    例如
    㑌、㓦、㘥、䀇……
    等特殊的汉字不能用  [一-龥]、或 [一-﨩]  这样的正则代码匹配到
    请教怎样写正则代码才能用配特殊的汉字?谢谢!
  • TA的每日心情
    开心
    2019-8-21 19:27
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    61

    主题

    627

    回帖

    16万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    162733

    QQ 章灌水大神章笑傲江湖章

    推荐
    发表于 2020-11-14 12:56:58 | 只看该作者
    本帖最后由 Mandolin 于 2020-11-14 13:16 编辑
    lwx228 发表于 2020-11-14 11:57
    CJK扩展A的6582个汉字(Unicode码0x3400-0x4db5)
    怎样才能变为正则?
    我在EmEditor试了多次不行。谢谢! ...


    EmEditor中的正则写法是:
    1. [\x{3400}-\x{4db5}]
    复制代码


    可以参考下面这张表,想要匹配哪个范围的字自己组合就好了:



    比如按你的情况写这个应该就够了(包含了中文符号和部首):

    1. [\x{2E80}-\x{FAFF}]
    复制代码
  • TA的每日心情
    无聊
    2022-7-21 15:56
  • 签到天数: 216 天

    [LV.7]常住居民III

    25

    主题

    646

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    16738
    2
    发表于 2020-11-14 09:15:16 | 只看该作者
    你这些特殊的汉字有何规律呀?
  • TA的每日心情
    无聊
    2023-2-17 11:35
  • 签到天数: 284 天

    [LV.8]以坛为家I

    20

    主题

    889

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10318

    QQ 章

    3
     楼主| 发表于 2020-11-14 09:32:33 | 只看该作者
    具体的我不懂、是mdx中转来的
    可能是不常用的繁体字?
  • TA的每日心情
    奋斗
    2020-5-22 08:16
  • 签到天数: 47 天

    [LV.5]常住居民I

    3

    主题

    192

    回帖

    9785

    积分

    进士

    Rank: 8Rank: 8

    积分
    9785

    QQ 章笑傲江湖章灌水大神章

    4
    发表于 2020-11-14 10:20:09 | 只看该作者
    \u0000-\u002C
    类似这样的,又或者这样的
    \x{4e00}-\x{9fa5}

    这得看你用正则支持哪个写法

    该用户从未签到

    539

    主题

    3046

    回帖

    25万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    251476

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    5
    发表于 2020-11-14 10:22:08 | 只看该作者
    这些字在扩充A区,把扩充A区带上就行
  • TA的每日心情
    无聊
    2023-2-17 11:35
  • 签到天数: 284 天

    [LV.8]以坛为家I

    20

    主题

    889

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10318

    QQ 章

    6
     楼主| 发表于 2020-11-14 11:47:13 | 只看该作者
    baodi 发表于 2020-11-14 10:20
    %u0000-%u002C
    类似这样的,又或者这样的
    \x{4e00}-\x{9fa5}

    谢谢!
    试了、
    这个范围还不如 ([一-﨩])
  • TA的每日心情
    无聊
    2023-2-17 11:35
  • 签到天数: 284 天

    [LV.8]以坛为家I

    20

    主题

    889

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10318

    QQ 章

    7
     楼主| 发表于 2020-11-14 11:49:26 | 只看该作者
    本帖最后由 lwx228 于 2020-11-14 11:52 编辑
    klwo2 发表于 2020-11-14 10:22
    这些字在扩充A区,把扩充A区带上就行


    谢谢!
    但要具体怎样写、我不懂。

    2020-11-14_11-52-05.png (53.07 KB, 下载次数: 0)

    2020-11-14_11-52-05.png
  • TA的每日心情
    无聊
    2023-2-17 11:35
  • 签到天数: 284 天

    [LV.8]以坛为家I

    20

    主题

    889

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10318

    QQ 章

    8
     楼主| 发表于 2020-11-14 11:53:17 | 只看该作者
    图中的标题没有答案
  • TA的每日心情
    无聊
    2023-2-17 11:35
  • 签到天数: 284 天

    [LV.8]以坛为家I

    20

    主题

    889

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10318

    QQ 章

    9
     楼主| 发表于 2020-11-14 11:57:06 | 只看该作者
    CJK扩展A的6582个汉字(Unicode码0x3400-0x4db5)
    怎样才能变为正则?
    我在EmEditor试了多次不行。谢谢!
  • TA的每日心情
    无聊
    2022-7-21 15:56
  • 签到天数: 216 天

    [LV.7]常住居民III

    25

    主题

    646

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    16738
    11
    发表于 2020-11-14 14:33:46 | 只看该作者
    Mandolin 发表于 2020-11-14 12:56
    EmEditor中的正则写法是:

    多谢大神普及汉字unicode编码指示,又学到一招
  • TA的每日心情
    无聊
    2023-2-17 11:35
  • 签到天数: 284 天

    [LV.8]以坛为家I

    20

    主题

    889

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10318

    QQ 章

    12
     楼主| 发表于 2020-11-14 17:14:05 | 只看该作者
    Mandolin 发表于 2020-11-14 12:56
    EmEditor中的正则写法是:

    非常感谢!