前言
同事把一个excel表给我,里面的数据大概有几千的样子吧。自己需要把里面的数据一个一个拿出来做一个http请求,对得到的结果进行过滤,然后再写到上面去。这是就涉及到用脚本来进行操作了,于是自己搞了一个Java的脚本出来,里面涉及到一些正则表达式,自己虽然说会,但是一直对 Matcher类中的group方法 不太了解。网上的博客也没有写的特别清楚,于是有了此文。
Pattern 和 Matcher
在java.util.regex 包下
Pattern(模式类) : 用来表达和陈述所要搜索模式的对象。Pattern.compile(pattern) pattern也就是你写的正则表达式Matcher(匹配器类):真正影响搜索的对象。上面Pattern.compile(pattern)得到一个Pattern对象 为r。r.matcher(line)line也即是你需要进行匹配的字符串 。这样会得到一个Matcher的对象。PatternSyntaxException: 当遇到不合法的搜索模式时,会抛出例外。
正则表达式语法
在有的语言中,一个反斜杠 \ 就足以具有转义的作用,但是Java中需要两个 \\ 反斜杠。表示转义的作用。一些字符在正则表达式中的说明,意义。详情可查看 runoob
上代码
现在我的正则表达式为 (//d+)([a-z]+)(//d+)
//d+表示最少匹配一个数字[a-z]+表示最少匹配一个字符- 需要指定的字符串为
"123ra9040 123123aj234 adf12322ad 222jsk22" - 代码如下 :
1 | 复制代码public static void main( String args[] ){ |
输出:
1 | 复制代码----i=0 |
group(0)对应着((//d+)([a-z]+)(//d+))123ra9040group(2)输出的数据 是group(0)中所匹配的数据 也就是([a-z]+)匹配到是数据ragroup(3)输出的数据 是group(0)中所匹配的数据 也就是(//d+)匹配到是数据9040
总结
Matcher类中group(0)表示正则表达式中符合条件的字符串。Matcher类中group(1)表示正则表达式中符合条件的字符串中的第一个() 中的字符串。Matcher类中group(2)表示正则表达式中符合条件的字符串中的第二个() 中的字符串。Matcher类中group(3)表示正则表达式中符合条件的字符串中的第三个() 中的字符串。- 如果不明白,我相信看代码会很明白的。
本文转载自: 掘金