文章摘要
这篇文章介绍了正则表达式中常用的关键字及其含义。元字符{m,n}表示前一个元素在匹配字符串中会重复出现的次数范围,其中m为最少出现次数,n为最多出现次数。例如,{3,5}表示该元素最少出现3次,最多出现5次,而{4}表示该元素恰好重复4次。此外,[]是范围描述符,用于匹配特定范围内的字符。例如,[a-z]表示匹配a到z范围内的任意一个字母。还有几个特殊字符需要说明:w表示字母或数字,s表示换行、制表符、回车、换行符或空格,b表示字边界。这些元字符在编程和数据处理中非常有用,能够帮助高效地匹配和处理特定的字符串模式。
{}: 重复次数(如 {4}表示前面的会重复出现恰好4次)
{m,n}: 前面元素最少出现m次,最多出现n次
[]: 范围描述符(如 [a-z]表示在a-z范围内的一个字母)
\w: 字符或数字,相当于[0-9A-Za-z]
\W: 非字母或数字
\s: [\t\n\r\f]空字符,相当于[\t\n\r\f]
\S: 非空字符
\d: [0-9]数字,相当于[0-9]
\D: 非数字字符
*: 前面元素出现0次或多次
+: 前面元素出现1次或多次
?: 前面元素最多出现1次
|:与前面或后面的表达式匹配
\b: 退格符(0x08)(仅在范围描述符内部时)
\b: 字边界(word boundary)(在范围描述符外部时)
\B: 非字边界
{}: 重复次数(如 {4}表示前面的会重复出现恰好4次)
{m,n}: 前面元素最少出现m次,最多出现n次
[]: 范围描述符(如 [a-z]表示在a-z范围内的一个字母)
\w: 字符或数字,相当于[0-9A-Za-z]
\W: 非字母或数字
\s: [\t\n\r\f]空字符,相当于[\t\n\r\f]
\S: 非空字符
\d: [0-9]数字,相当于[0-9]
\D: 非数字字符
*: 前面元素出现0次或多次
+: 前面元素出现1次或多次
?: 前面元素最多出现1次
|:与前面或后面的表达式匹配
\b: 退格符(0x08)(仅在范围描述符内部时)
\b: 字边界(word boundary)(在范围描述符外部时)
\B: 非字边界
© 版权声明
文章版权归作者所有,未经允许请勿转载。



