1、正则表达式:满足某种规则的字符串 2、常用规则写法: (1). 字符 字符x : 举例: ‘a’就代表字符a \ : 反斜线字符 \n : 新行(换行)符(‘u00A’) \r : 回车符(‘\u00D’) (2).字符类 [abc] : a、b或c(简单类) [^abc] : 任何字符,除了a、b和c [a-zA-Z] : a到z 或A到Z , 两头的字母都包括在内 [0-9] : 0到9的字符都包括 (3).预定义字符类 . : 表示任意字符,如果就是要表示 . 则用 . \d : 表示数字[0-9] \D : 表示任意字符,除了数字[0-9] \w : 单词字符 [a-zA-Z_0-9] 在正则表达式中组成单词的东西必须由字母、下划线和数字组成 注意:在代码中都需要在\前面再加一个\才能表示转义字符,即\d , \D , \w等 (4). 边界匹配器 ^ :行的开头 ¥:行的结尾 \b : 单词边界 就是不是单词字符的地方 举例:hello world?123; 其中,o后面的 空格 和 ? 还有 ; 都是单词边界 (5)数量词 Greedy X? : X出现0次或1次 X*:X出现0次或者1次以上包括1次 X+:X出现1次或多次 X{n} : X恰好n次 X{n,}:X至少n次 X{n,m}:X至少n次,但是不超过m次
3、正则表达式的应用
(1) 判断功能 : String类中的public boolean matches(String regex) ; //regex表示规则,自己定义规则字符串regex即可。
例如:String regex = "\\w+@\\w{2,6}(\\.\\w{2,3})+" 该规则应该这样拆解:从左往右,依次 \\w+ 表示前面存在一个或多个满足[a-zA-Z_0-9]的字符 @ 表示这里有一个@字符 \\w{2,6} 表示这里存在最少2个,最多6个字符 (\\.\\w{2,3})+ 表示这里存在一个或多个满足 开始是 . 后面是2到3个的字符 的规则的整体 如果有String email = "zsl@qq.com.cn" ; 那么此时boolean flag = email.mathces(regex) 中的 flag =true ;(2) 分割功能 : String类中的 public String[] split(String regex) ;
//例1: //定义一个年龄搜索范围 String ages = "18-24" ; //定义规则 String regex = "-" ; //调用方法 String[] strArray = ages.split(regex) ; //遍历数组 for(int i = 0 ; i < strArray.length ; i++) system.out.println(strArray[i]) ; //以上程序遍历的结果就是 18 // 24 //只需要将其转换为int值,就可以为我们所用了 int startAge = Integer.parseInt(strArray(0)) ; int endAge = Integer.parseInt(strArray(1)) ; //例2: //定义一个字符串 String s2 = "aa.bb.cc" ; //直接分割,即规则直接写在分割方法中 String[] s2Array = s1.split("\\.") ; //一定要注意这里的规则中如果是要以 . 作为分割符,那么必须要用转义字符,在代码中需要2个\,即 \\. //遍历数组 for(int i = 0 ; i < s2Array.length ; i++) system.out.println(s2Array[i]) ; //遍历结果就是 aa bb cc //例3 //定义一个字符串 String s3 = "aa bb cc" ; //直接分割,那么此时的分割规则符应该是什么? String[] s3Array = s3.split(" +") ; //这里规则是如果有1个或者多个空格,就把所有的空格都省掉,因此需要加一个 + //例4 //要把一个文件路径的文件夹名分割开 //首先在每个\前面再加一个\,如下 String s4 = "E:\\Java\\day14\\avi" //直接分割,分割符应该是什么? String[] s4Array = s4.split("\\\\") ; //因为在代码中转义字符实际应该是\\ , 分隔符又是\\ ,因此一共是4个\, 即\\\\ //遍历数组 for(int i = 0 ; i < s2Array.length ; i++) system.out.println(s2Array[i]) ; //遍历结果就是 E: Java day14 avi(3) 替换功能 : public String replaceAll(String regex , String replacement)
//例如: //定义一个字符串 String str = "helloqq12345phone15298764532" ; String s = "*" //要把所有数字变成* String regex1 = "\\d+" ; String result1 = s.replaceAll(regex1 , s) ; //结果为helloqq*phone* //要把每个数字都变成* String regex2 = "\\d" ; String result2 = s.replaceAll(regex2 , s) ; //结果为hello*****phone*********** //把数字直接忽略 String ss = "" String regex3 = "\\d+" String regex3 = s.replaceAll(regex3 , ss) ; //结果为hellophone(4) 获取功能 : Pattern 和 Matcher类的使用
//例如:获取一个字符串中3位字符的单词 //先创建字符串 String s = "da jia wan shang hao!" ; //定义规则 String regex = "\\b\\w{3}\\b" ; //注意!\\b表示这里是单词边界,也就是只能有3个单词字符存在 //把规则编译模式对象 ------->这是实现获取功能的第一步--创建模式对象Pattern Pattern p = Pattern.compile(regex) ; //通过模式对象得到匹配器对象 ------->这是实现获取功能的第二步--创建匹配器对象Matcher Matcher m = p.matcher(s) ; //调用匹配器对象的功能 --------->这是实现获取功能的第三步--调用Matcher的对象方法find()和group() while(m.find()){ //首先调用匹配器对象的find方法查找是否存在满足的东西 System.out.println(m.group()) ; //group()方法是查找到满足规则的子串并返回回来,因为group()方法一次只能找到一个,因此需要while循环 }