求助汉字与两字符以上的字母转义字符

dfsfd · 发表于 2018-10-11 23:09:36

本帖最后由 dfsfd 于 2018-10-11 23:10 编辑

求助：汉字与两字符以上的字母转义字符是什么呐？
如图所示，图中\1 \2 到底该填什么呢？

lgmcw · 发表于 2018-10-12 04:01:40

本帖最后由 lgmcw 于 2018-10-12 04:02 编辑

如果是提取词性，不知道你的文本编辑器支不支持

([A-Za-z]+?\.)(\s)

复制代码

替换为

<span>$1</span>$2

复制代码

leescott · 发表于 2018-10-12 07:57:36

我自己是这样的。
([\u4e00-\u9fa5])([A-Za-z]{1,7}\.)

替换结果不用加点。
一句话，1，2这样用，必须加括号。

leescott · 发表于 2018-10-12 08:03:27

本帖最后由 leescott 于 2018-10-12 08:07 编辑

如果只是想替换几种词性。可以考虑EmEditor里面替换的批处理。（看到有些词性前面没有汉字。）
不用正则表达式的情况下，填入您的替换，加入到批处理，导出，就知道他的格式。然后打开规则文件，在excel或者EmEditor加入其他的，一行一个规则。导入，替换。补充一句，批量替换支持正则表达式，或者混合，这里觉得可以不用正则表达式，

jeanleem6 · 发表于 2018-10-12 10:47:57

本帖最后由 jeanleem6 于 2018-10-12 10:52 编辑

不清楚你具体要达到什么目的，这里假设你要实现这样的功能：

原始数据：

reference
<link rel="stylesheet" type="text/css" href="wystjxsc_HW.css"><wystjxsc_HW>reference</wystjxsc_HW><div class="hkwd">n. 参考，出处，参照 n.推荐人，推荐函vt.提供参考</div>
</>

复制代码

期望数据：

reference
<link rel="stylesheet" type="text/css" href="wystjxsc_HW.css"><wystjxsc_HW>reference</wystjxsc_HW><div class="hkwd">
<div class="item"><span class="type">n.</span><span class="explain">参考，出处，参照</span></div>
<div class="item"><span class="type">n.</span><span class="explain">推荐人，推荐函</span></div>
<div class="item"><span class="type">vt.</span><span class="explain">提供参考</span></div>
</div>
</>

复制代码

这里做了换行处理，主要是便于浏览，下面的正则替换没有做这个功能。
--------------------------
正则：

([a-zA-Z]+?)[ ]*?\.[ ]*?([\x{4e00}-\x{9fa5}，,\.]+)

复制代码

替换：

<div class="item"><span class="type">\1\.</span><span class="explain">\2</span></div>

复制代码

---------------------------
代码解释：

([a-zA-Z]+?)  这是用来提取词性（替换中的 \1）。如果要提取两个字母及以上：([a-zA-Z]{2,})[ ]*?\.

[ ]*?  这表示有0个或多个空格

([\u4e00-\u9fa5，,\.]+)  这是用来提取汉语解释（替换中的 \2）。考虑到多个汉语解释之间会有分隔符号，这里添加了中文的逗号，英文的逗号和句号（正则中英文句号是元字符，需要用 "\" 做转义处理），
也可能会有其它分隔符（比如："、"、"/"、" "等，注意元字符要做转义处理），可以都加进去。

注意：如果你用sublime编辑器的话，汉字区间的表示有点不一样：[\x{4e00}-\x{9fa5}]

dfsfd · 发表于 2018-10-12 23:32:23

lgmcw 发表于 2018-10-12 04:01
如果是提取词性，不知道你的文本编辑器支不支持

替换为

十分感谢，一眼就看出了我要提出词性来，感谢指导！

dfsfd · 发表于 2018-10-12 23:35:46

leescott 发表于 2018-10-12 08:03
如果只是想替换几种词性。可以考虑EmEditor里面替换的批处理。（看到有些词性前面没有汉字。）
不用正则表 ...

感谢您的正则，但不用正则是提不出词性的，数据远比截图中的复杂，如vt. &vi. ，所以来求助提出词性的正则。

dfsfd · 发表于 2018-10-12 23:38:33

jeanleem6 发表于 2018-10-12 10:47
不清楚你具体要达到什么目的，这里假设你要实现这样的功能：

原始数据：

十分感谢你写的正则，对我帮助很大，很全面。（本意是提出词性）

[求助] 求助汉字与两字符以上的字母转义字符

评分

评分

评分

评分

[求助] 求助 汉字与两字符以上的字母转义字符

评分

评分

评分

评分

[求助] 求助汉字与两字符以上的字母转义字符