查看: 434|回复: 2
打印 上一主题 下一主题

[求助] 正则表达式

[复制链接]

该用户从未签到

2

主题

82

回帖

2158

积分

禁止发言

积分
2158
跳转到指定楼层
1
发表于 2019-8-16 02:09:34 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
∮阿 <a name="_topw"></a> <a name="_hkw1"></a><link href="廣韻.css" rel="stylesheet" type="text/css"> <span class="pc">於何12個  第207歌</span><div class="sy"><div class="sy2"><span class="zitou"> 阿</span><span class="kx"> 於何切說文大陵也一曰曲阜一曰比也一曰慢應亦姓 </span></div></div><div class="yema">第<a class="yy" href="../../jiyuns/orgpage.html?page=196" target=_blank">196</a>頁第03行第06字</div><!--yema-->
问题:请问各位,如何用正则表达式,只保留开头的汉字“阿”以及page=196中的页码196?我是要处理上万个字头及页码的,请问如何用正则表达式都把所有的字头和相应的页码提取出来,其余的都删除掉?
  • TA的每日心情
    慵懒
    2021-9-28 14:33
  • 签到天数: 158 天

    [LV.7]常住居民III

    5

    主题

    907

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    17310

    QQ 章灌水大神章笑傲江湖章推广专家

    推荐
    发表于 2019-8-16 07:47:37 | 只看该作者
    本帖最后由 atauzki 于 2019-8-16 08:18 编辑

    (?<=class="zitou">)(.*?)(?=<\/span>)(?:.*?)(?<=a class="yy").*?>(\d+)(?=<\/a>)
    emeditor中提取(不是替换)为\1 \2

    该用户从未签到

    2

    主题

    82

    回帖

    2158

    积分

    禁止发言

    积分
    2158
    3
     楼主| 发表于 2019-8-16 13:28:51 | 只看该作者
    atauzki 发表于 2019-8-16 07:47
    (?)(.*?)(?=)(?:.*?)(?(\d+)(?=)
    emeditor中提取(不是替换)为\1 \2

    谢谢一大早回答,中午我才有空看到。谢谢!