查看: 472|回复: 8
打印 上一主题 下一主题

[求助] 正则表达式问题。

[复制链接]
  • TA的每日心情
    开心
    2022-5-4 10:45
  • 签到天数: 276 天

    [LV.8]以坛为家I

    26

    主题

    453

    回帖

    9710

    积分

    进士

    Rank: 8Rank: 8

    积分
    9710
    跳转到指定楼层
    1
    发表于 2018-12-26 09:21:49 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 sagog 于 2018-12-26 09:27 编辑

    豬婆
    <link type="text/css" rel="stylesheet" href="hydcd.css"/><h2>豬婆</h2>(豬婆,猪婆)</span><BR><com>母豬。</com><br>
    <link type="text/css" rel="stylesheet" href="hydcd.css"/><h2>豬婆</h2>補證條目</span><br>“南邊人的俗語,叫作貪嵞買豬婆肉。”</span>
    <link type="text/css" rel="stylesheet" href="hydcd.css"/><h2>稅籍</h2>(稅籍,税籍)</span><BR><com>徵稅的簿冊。</com><br><span class="example">《
    </>
    一拍卽合
    <link type="text/css" rel="stylesheet" href="hydcd.css"/><h2>一拍卽合</h2><com>原指一打拍子就合於樂曲的節奏。 比喻一下子就能夠互相吻合。</com>
    <link type="text/css" rel="stylesheet" href="hydcd.css"/><h2>一拍卽合</h2>補證條目<br>原指一打拍子就合於樂曲的節奏。比喻一下子就能夠互
    <link type="text/css" rel="stylesheet" href="hydcd.css"/><h2>剝取</h2>(剝取,剥取)</span>猶榨取。</com><br><span class="example"><span
    </>


    从上述情况中删除其他词条的正则表达式是什么?

    <h2>稅籍</h2>與<h2>剝取</h2>行
  • TA的每日心情
    奋斗
    2020-1-3 10:54
  • 签到天数: 159 天

    [LV.7]常住居民III

    6

    主题

    253

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11343
    2
    发表于 2018-12-26 09:41:53 | 只看该作者
    你是想保留的是<h2>标签内的内容,还是什么意思?
  • TA的每日心情

    前天 00:54
  • 签到天数: 344 天

    [LV.8]以坛为家I

    1

    主题

    703

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    12764
    3
    发表于 2018-12-26 09:53:28 | 只看该作者
    没明白正则是要删除啥。
  • TA的每日心情
    开心
    2022-5-4 10:45
  • 签到天数: 276 天

    [LV.8]以坛为家I

    26

    主题

    453

    回帖

    9710

    积分

    进士

    Rank: 8Rank: 8

    积分
    9710
    4
     楼主| 发表于 2018-12-26 10:00:13 | 只看该作者
    OldFarmer 发表于 2018-12-26 09:41
    你是想保留的是标签内的内容,还是什么意思?


    我想用正则表达式删除其他词条。


    我想得到以下结果。

    豬婆
    <link type="text/css" rel="stylesheet" href="hydcd.css"/><h2>豬婆</h2>(豬婆,猪婆)</span><BR><com>母豬。</com><br>
    <link type="text/css" rel="stylesheet" href="hydcd.css"/><h2>豬婆</h2>補證條目</span><br>“南邊人的俗語,叫作貪嵞買豬婆肉。”</span>

    </>
    一拍卽合
    <link type="text/css" rel="stylesheet" href="hydcd.css"/><h2>一拍卽合</h2><com>原指一打拍子就合於樂曲的節奏。 比喻一下子就能夠互相吻合。</com>
    <link type="text/css" rel="stylesheet" href="hydcd.css"/><h2>一拍卽合</h2>補證條目<br>原指一打拍子就合於樂曲的節奏。比喻一下子就能夠互
    </>
  • TA的每日心情
    奋斗
    2020-1-3 10:54
  • 签到天数: 159 天

    [LV.7]常住居民III

    6

    主题

    253

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11343
    5
    发表于 2018-12-26 10:21:42 | 只看该作者
    我还是没有看懂你的意思
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    73

    主题

    1552

    回帖

    9万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    96973

    QQ 章笑傲江湖章灌水大神章推广专家

    6
    发表于 2018-12-26 10:41:27 | 只看该作者
    本帖最后由 VimVim 于 2018-12-26 11:21 编辑

    Vim的解决方案:
    1、采用Vim宏命令,自动获取词头并存入寄存器a(具体请自行解决)
    2、使用vim的替换命令(其中^Ra指上述寄存器a中的内容,而非普通字符),将非词头的行删除:
    :s/\v(.*)(\<h2\>((?!^Ra).)+\<\/h2\>)(.*)//
    3、将上述指令存入Vim宏命令,批量实施:具体案例可参考
    https://www.pdawiki.com/forum/fo ... d=32243&pid=1033507

    具体测试结果请查看:

    在线测试正则表达式:https://c.runoob.com/front-end/854
    测试用例:(.*)(\<h2\>((?!豬婆).)+\<\/h2\>)(.*)
    这与上述Vim指令相比:
    (1)少了Vim替换命令相关的内容,(2)“豬婆”等具体关键词,Vim会自动从上述第一步获取。






  • TA的每日心情
    开心
    2022-5-4 10:45
  • 签到天数: 276 天

    [LV.8]以坛为家I

    26

    主题

    453

    回帖

    9710

    积分

    进士

    Rank: 8Rank: 8

    积分
    9710
    7
     楼主| 发表于 2018-12-26 10:51:54 | 只看该作者
    OldFarmer 发表于 2018-12-26 10:21
    我还是没有看懂你的意思



    在合并过程中这是错误的,这部分发生了很多。

    1.jpg (214.43 KB, 下载次数: 0)

    1.jpg

    2.jpg (112.73 KB, 下载次数: 0)

    2.jpg
  • TA的每日心情
    奋斗
    2020-5-22 08:16
  • 签到天数: 47 天

    [LV.5]常住居民I

    3

    主题

    192

    回帖

    9785

    积分

    进士

    Rank: 8Rank: 8

    积分
    9785

    QQ 章笑傲江湖章灌水大神章

    8
    发表于 2018-12-26 18:29:18 | 只看该作者
    查找
    1. (<h2>(?'name1'[^<>]*)</h2>.*)\n.+?<h2>(?!\k'name1').*$
    复制代码

    替换
    1. \1
    复制代码

    替换一下
    我用的这个是PCRE正则表达式格式.可能和你的显示不同,自行研究修改.

    思路:
  • TA的每日心情
    开心
    2022-5-4 10:45
  • 签到天数: 276 天

    [LV.8]以坛为家I

    26

    主题

    453

    回帖

    9710

    积分

    进士

    Rank: 8Rank: 8

    积分
    9710
    9
     楼主| 发表于 2018-12-27 08:46:09 | 只看该作者

    非常感谢你