使用正则表达式

正则表达式通常用于判断语句中,用来检查某一字符串是否满足某一格式。正则表达式是含有一些具有特殊意义字符的字符串,这些特殊字符称为正则表达式的元字符。例如,“\\d” 表示数字0~9中的任何一个,“\d” 就是元字符。正则表达式中的元字符及其意义如表10.5所示。

image 2024 03 01 15 30 37 563
Figure 1. 表10.5 正则表达式中的元字符

在正则表达式中,“.” 代表任何一个字符,因此在正则表达式中如果想使用普通意义的点字符 “.”,必须使用转义字符 “\”。

在正则表达式中,可以使用方括号括起若干个字符来表示一个元字符,该元字符可代表方括号中的任何一个字符。例如,reg = "[abc]4",这样字符串 a4、b4、c4 都是和正则表达式匹配的字符串。方括号元字符还可以为其他格式,具体如下。

  • [^456]:代表4、5、6之外的任何字符。

  • [a-r]:代表a~r的任何一个字母。

  • [a-zA-Z]:可表示任意一个英文字母。

  • [a-e[g-z]]:代表a~e或g~z的任何一个字母(并运算)。

  • [a-o&&[def]]:代表字母d、e、f(交运算)。

  • [a-d&&[^bc]]:代表字母a、d(差运算)。

在正则表达式中允许使用限定修饰符来限定元字符出现的次数。例如,“A*” 代表 A 可在字符串中出现 0 次或多次。限定修饰符的用法如表10.6所示。

image 2024 03 01 15 32 51 217
Figure 2. 表10.6 限定修饰符

【例10.17】验证E-mail地址是否“合法”(实例位置:资源包\TM\sl\10\17)

在项目中创建 Judge 类,使用正则表达式来判断 “aaa@”“aaaaa”“1111@111ffyu.dfg.com” 3 个 E-mail 地址哪一个是合法的。实例代码如下:

public class Judge {
	public static void main(String[] args) {
		// 定义要匹配E-mail地址的正则表达式
		String regex = "\\w+@\\w+(\\.\\w{2,3})*\\.\\w{2,3}";
		String str1 = "aaa@"; // 定义要进行验证的字符串
		String str2 = "aaaaa";
		String str3 = "1111@111ffyu.dfg.com";
		if (str1.matches(regex)) { // 判断字符串变量是否与正则表达式匹配
			System.out.println(str1 + "是一个合法的E-mail地址格式");
		}
		if (str2.matches(regex)) {
			System.out.println(str2 + "是一个合法的E-mail地址格式");
		}
		if (str3.matches(regex)) {
			System.out.println(str3 + "是一个合法的E-mail地址格式");
		}
	}
}

运行结果如图10.22所示。

image 2024 03 01 15 33 57 291
Figure 3. 图10.22 例10.17的运行结果

正则表达式分析:通常情况下,E-mail 的格式为 “X@X.com.cn”。字符 X 表示任意的一个或多个字符,@ 为 E-mail 地址中的特有符号,符号 @ 后还有一个或多个字符,之后是字符 “.com”,也可能后面还有类似 “.cn” 的标记。总结 E-mail 地址的这些特点,可以书写正则表达式 “\\w+@\\w+(\\.\\w{2,3})\\.\\w{2,3}” 来匹配 E-mail 地址。字符集 “\\w” 匹配任意字符,符号 “+” 表示字符可以出现1次或多次,表达式 “(\\.\\w{2,3})” 表示形如 “.com” 格式的字符串可以出现 0 次或多次,而最后的表达式 “\\.\\w{2,3}” 用于匹配 E-mail 地址中的结尾字符,如 “.cn”。

编程训练(答案位置:资源包\TM\sl\10\编程训练)

【训练11】判断 “ABAB” 形式的数字 在控制台上输入一个4位数字,判断其是否为 “ABAB” 形式的数字。

【训练12】校验密码复杂程度 密码校验:8~20位,要求至少包含小写字母、大写字母或数字中的两种。判断密码 “dave1234” 是否符合要求。如果符合,在控制台上输出 “此密码符合要求!”;反之,在控制台上输出 “请按要求重新设置密码…​…​”。