Java学习者论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

恭喜Java学习者论坛(https://www.javaxxz.com)已经为数万Java学习者服务超过8年了!积累会员资料超过10000G+
成为本站VIP会员,下载本站10000G+会员资源,购买链接:点击进入购买VIP会员
JAVA高级面试进阶视频教程Java架构师系统进阶VIP课程

分布式高可用全栈开发微服务教程

Go语言视频零基础入门到精通

Java架构师3期(课件+源码)

Java开发全终端实战租房项目视频教程

SpringBoot2.X入门到高级使用教程

大数据培训第六期全套视频教程

深度学习(CNN RNN GAN)算法原理

Java亿级流量电商系统视频教程

互联网架构师视频教程

年薪50万Spark2.0从入门到精通

年薪50万!人工智能学习路线教程

年薪50万!大数据从入门到精通学习路线年薪50万!机器学习入门到精通视频教程
仿小米商城类app和小程序视频教程深度学习数据分析基础到实战最新黑马javaEE2.1就业课程从 0到JVM实战高手教程 MySQL入门到精通教程
查看: 311|回复: 0

[正则表达式学习]正则表达式中的懒惰匹配与非捕获组

[复制链接]
  • TA的每日心情
    开心
    2021-3-12 23:18
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2014-11-1 00:01:23 | 显示全部楼层 |阅读模式
    正则表达式中包含能接受重复的限定符(指定数量的代码,例如*,{5,12}等)时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符。

         考虑这个表达式:a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。     有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。现在看看懒惰版的例子吧:      a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab和ab。
      
       
       
         
       

         
       
      
      举例1:
        表达式 "<td>(.*)</td>" 与字符串 "<td><p>aa</p></td> <td><p>bb</p></td>" 匹配时,匹配的结果是:成功;匹配到的内容是 "<td><p>aa</p></td> <td><p>bb</p></td>" 整个字符串, 表达式中的 "</td>" 将与字符串中最后一个 "</td>" 匹配。  举例2:
        相比之下,表达式 "<td>(.*?)</td>" 匹配举例1中同样的字符串时,将只得到 "<td><p>aa</p></td>", 再次匹配下一个时,可以得到第二个 "<td><p>bb</p></td>"。 懒惰限定符
    *? 重复任意次,但尽可能少重复
    +? 重复1次或更多次,但尽可能少重复
    ?? 重复0次或1次,但尽可能少重复
    {n,m}? 重复n到m次,但尽可能少重复
    {n,}? 重复n次以上,但尽可能少重复

    这个例子供测试:
    import java.util.regex.*;
    public class Test{
       public static void main(String[] args) {
         //String s = "<td><<p>aa</p></td> <td><p>bb</p></td>";//用于其它测试
         String s = "<td>aa555</td><td>bbb</td><td>abc</td>";//用于{1,40},{1,}测试
         //String s = "<td>a</td><td>b</td><td></td>";//用于.??测试
         //String regex="<td>(.*)</td>";

          //String regex="<td>(.*?)</td>";
          // String regex="<td>(.+?)</td>";
          //String regex="<td>(.??)</td>";
          //String regex="<td>(.{1,40}?)</td>";
          String regex="<td>(.{1,}?)</td>";
          Pattern pt=Pattern.compile(regex);
          Matcher mt=pt.matcher(s);
          while(mt.find()){
            System.out.println(mt.group(1).trim());
          }
        }
    }  非捕获组(?:Exp):匹配Exp部分正则表达式,但匹配的结果并不保存到捕获组,一般在验证规则时使用,因为保存捕获组都要占用一定的内存资源,而不需要保留匹配结果时,可以使用非捕获组来节省资源  import java.util.regex.*;

    public class Test {
       public static void main(String[] args) {
         String str = "<a href="11"> <font color="21">aaa </font> </a>" +
            "<a href="12"> <font color="22">bbb </font> </a>" +
            "<a href="13">ccc </a> " +
            "<a href="14"> <font color="23">ddd </font> </a>" +
            "<a href="15"> <font color="25">eee </font> </a> " +
            "<a href="16">fff </a> ";
         String regex = "<a.*?>(?:\s*<font[^>]*>)?(.*?)(?:</font>\s*)?</a>";
         Pattern pattern = Pattern.compile(regex);
         Matcher matcher = pattern.matcher(str);
         while(matcher.find()) {
           System.out.println(matcher.group(1));
         }
       }
    } 这个例子的运行结果是:
    C:java>java Test
    aaa
    bbb
    ccc
    ddd
    eee
    fff

      
      
       
       

         
       

         
       
      
    复制代码

    源码下载:http://file.javaxxz.com/2014/11/1/000123015.zip
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|手机版|Java学习者论坛 ( 声明:本站资料整理自互联网,用于Java学习者交流学习使用,对资料版权不负任何法律责任,若有侵权请及时联系客服屏蔽删除 )

    GMT+8, 2025-2-25 17:35 , Processed in 0.304896 second(s), 36 queries .

    Powered by Discuz! X3.4

    © 2001-2017 Comsenz Inc.

    快速回复 返回顶部 返回列表