正则表达式(Regular Expression,简称 RegEx)是一种强大的文本匹配工具,广泛应用于字符串搜索、替换和验证等场景。
1. 基本概念
1.1 创建正则表达式
在 JavaScript 中,可以通过两种方式创建正则表达式:
-
字面量表示法:
const regex = /pattern/flags;
-
构造函数表示法:
const regex = new RegExp('pattern', 'flags');
1.2 常用标志
g
:全局匹配,查找所有匹配项,而不是在第一个匹配项后停止。i
:忽略大小写。m
:多行模式,改变^
和$
的行为,使其匹配每一行的开头和结尾,而不仅仅是整个字符串的开头和结尾。u
:Unicode 模式,使正则表达式能够正确处理 Unicode 字符。y
:粘连模式,从目标字符串的当前位置开始匹配。
2. 基本元字符
2.1 匹配单个字符
.
:匹配除换行符以外的任何单个字符。\w
:匹配任何字母数字字符及下划线,等同于[A-Za-z0-9_]
。\W
:匹配任何非字母数字字符及下划线,等同于[^A-Za-z0-9_]
。\d
:匹配任何数字,等同于[0-9]
。\D
:匹配任何非数字,等同于[^0-9]
。\s
:匹配任何空白字符,包括空格、制表符、换页符等。\S
:匹配任何非空白字符。[abc]
:匹配方括号内的任意一个字符。[^abc]
:匹配不在方括号内的任意一个字符。
2.2 重复匹配
*
:匹配前面的子表达式零次或多次。+
:匹配前面的子表达式一次或多次。?
:匹配前面的子表达式零次或一次。{n}
:匹配前面的子表达式恰好 n 次。{n,}
:匹配前面的子表达式至少 n 次。{n,m}
:匹配前面的子表达式至少 n 次,最多 m 次。
2.3 锚定
^
:匹配输入字符串的开始位置。$
:匹配输入字符串的结束位置。\b
:匹配单词边界。\B
:匹配非单词边界。
2.4 分组和引用
()
:分组,用于捕获匹配的子字符串。(?:...)