Java正则表达式中group()、group(i)、groupCount的含义

发表于:2008-07-14来源:作者:点击数: 标签:javaJAVAJavaPattern正则表达式中
花了两个小时才搞明白,有点儿笨:P 首先弄明白 Java 的正则表达式中捕获组的概念,也就是以括号对“()”分割出的子Pattern,为什么要用到子模式呢?这是为了能在一次匹配中找出关心部分,例如: input: abbc pattern:a(b*)c group0: a(b*)c group1:(b*) 整个
花了两个小时才搞明白,有点儿笨:P

首先弄明白Java的正则表达式中捕获组的概念,也就是以括号对“()”分割出的子Pattern,为什么要用到子模式呢?这是为了能在一次匹配中找出关心部分,例如:
input: abbc
pattern:a(b*)c
group0: a(b*)c
group1:(b*)

整个pattern是可以匹配abbc的,group()方法就是获得当前查找里面整个pattern所匹配的子序列,所以你可以通过group()找到“abbc”;

与此同时,我还对其中的b的个数感兴趣,就可以通过group1来得到关于(b*)的匹配情况,group(i)就是获得当前查找里面指定的捕获组所匹配的子序列,所以你可以通过group(0)来找到“bb”;

上面说清楚了,groupCount()的含义就很容易明白了,它并不是指在输入序列中Pattern总共匹配了多少次,而是指的捕获组的个数,当然它不对“整个pattern”计数,而只对“子Pattern”计数,如上例中groupCount()返回1,而如果我们将input改为“abbc abbc abbc”,——有三次匹配——groupCount()还是返回1 ;

好了,我想废了半天话,概念应该讲清楚了,希望日后能记在脑袋里,不要天天来烦blogger.com:P
注意:group(i)是在group()的结果中再匹配

原文转自:http://www.ltesting.net