Java学习者论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

恭喜Java学习者论坛(https://www.javaxxz.com)已经为数万Java学习者服务超过8年了!积累会员资料超过10000G+
成为本站VIP会员,下载本站10000G+会员资源,购买链接:点击进入购买VIP会员
JAVA高级面试进阶视频教程Java架构师系统进阶VIP课程

分布式高可用全栈开发微服务教程

Go语言视频零基础入门到精通

Java架构师3期(课件+源码)

Java开发全终端实战租房项目视频教程

SpringBoot2.X入门到高级使用教程

大数据培训第六期全套视频教程

深度学习(CNN RNN GAN)算法原理

Java亿级流量电商系统视频教程

互联网架构师视频教程

年薪50万Spark2.0从入门到精通

年薪50万!人工智能学习路线教程

年薪50万!大数据从入门到精通学习路线年薪50万!机器学习入门到精通视频教程
仿小米商城类app和小程序视频教程深度学习数据分析基础到实战最新黑马javaEE2.1就业课程从 0到JVM实战高手教程 MySQL入门到精通教程
查看: 365|回复: 0

[正则表达式学习]java正则表达式学习笔记3.4

[复制链接]
  • TA的每日心情
    开心
    2021-3-12 23:18
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2014-10-31 00:00:27 | 显示全部楼层 |阅读模式
    括号的用途:反向引用
    作用:在表达式的某一部分,动态重复之前子表达式所匹配的文本
    形式:1
    例子:

    1. public class GeneralNine {
    2.   public static void main(String[] args) {
    3.   String[] strs = new String[] { "< h1>good,good< /h1>", "< h1>bad< /h2>"};
    4.   String regex = "< \w+>[^<]+< /\w+>";
    5.   for (String string : strs) {
    6.    if(regexMatch(string,regex)){
    7.      System.out.println(string +"能够匹配正则:" + regex);
    8.    }else{
    9.      System.out.println(string +"不能够匹配正则:" + regex);
    10.    }
    11. }
    12. }
    13.   private static boolean regexMatch(String s, String regex) {
    14.    return s.matches(regex);
    15.   }
    16. }
    复制代码
    运行结果:
    <h1>good,good</h1>能够匹配正则:<w+>[^<]+</w+>
    <h1>bad</h2>能够匹配正则:<w+>[^<]+</w+>

    第一段为合法HTML代码,第二段为不合法html代码。
    [^<]+匹配非<的任意多个字符

    <\w+[^<]+</\w+>;

    开头用来匹配开始tag
    结尾用来匹配结束tag
    中间用来匹配文本。
    发现这个正则表达式,既能匹配合法,又能匹配不合法的。

    因为匹配开始tag和结束tag的两个子表达式,并没有什么联系,也就是说匹配的结束tag并不等于开始的tag

    下面用反向引用在两个子表示之间建立联系:
    String regex = "<(\w+)>[^<]+</(\1)>";
    运行结果:
    <h1>good,good</h1>能够匹配正则:< (w+)>[^<]+</(1)>
    <h1>bad</h2>不能够匹配正则:< (w+)>[^<]+</(1)>

    对匹配开始tag的子表达式添加捕获分组:
    <(\w+)

    在匹配结束tag的子表达式中,使用1这个反向引用的功能:
    </(\1)>引用之前的子表达式:(\w+)

    补充:
    一些题外话;使用正则表达式替换的时候,也可以使用反向引用的功能。
    例子:
    public class GeneralEvelent {
       public static void main(String[] args) {
        String dupWords = "word word";
        String dupWordRegex = "(\w+)\s+(\1)";
        System.out.println("替换之前:"+dupWords);
        System.out.println("替换之后:"
         dupWords.replaceAll(dupWordRegex, "$1"));
       }
    }

    运行结果:
    替换之前:word word
    替换之后:word
    简单的去掉重复单词的例子

    dupWords.replaceAll(dupWordRegex, "$1")

    $1按照java语言规定,这个特殊变量对应的是正则表达式中编号为1的分组所捕获的字符串。
    也就是说将两个重复单词的字符串,替换为单个重复单词的字符串,这样就去掉了一个重复单词。

    小结
    量词:规定之前元素出现的次数
    *,+,?
    区间量词:{min,max}
    量词的局限:括号(...)的使用
    括号的用途:多选分支
    括号的用途:捕获分组
    括号的用途:反向引用


      
      
       
       

         
       

         
       
      
    复制代码

    源码下载:http://file.javaxxz.com/2014/10/31/000027265.zip
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|手机版|Java学习者论坛 ( 声明:本站资料整理自互联网,用于Java学习者交流学习使用,对资料版权不负任何法律责任,若有侵权请及时联系客服屏蔽删除 )

    GMT+8, 2025-2-25 19:34 , Processed in 0.293146 second(s), 36 queries .

    Powered by Discuz! X3.4

    © 2001-2017 Comsenz Inc.

    快速回复 返回顶部 返回列表