什么是正则表达式?
基本说来,正则表达式是一种用来描述一定数量文本的模式。 代表
。本文将用来表示一段具体的正则表达式。
不同的正则表达式引擎
正则表达式引擎是一种可以处理正则表达式的软件。通常,引擎是更大的应用程序的一部
分。在软件世界,不同的正则表达式并不互相兼容。
文字符号
最基本的正则表达式由单个文字符号组成。如,它将匹配字符串中第一次出现
的字符“。如对字符串“。“后的“将被匹配。而第二个“将不会被匹配。
正则表达式也可以匹配第二个“,这必须是你告诉正则表达式引擎从第一次匹配的地方开
始搜索。在文本编辑器中,你可以使用“查找下一个”。在编程语言中,会有一个函数可以使你
从前一次匹配的位置开始继续向后搜索。
类似的,会匹配“中的“。这等于是告诉正
则表达式引擎,找到一个,紧跟一个,再跟一个。
要注意,正则表达式引擎缺省是大小写敏感的。除非你告诉引擎忽略大小写,否则
不会匹配“。
特殊字符
对于文字字符,有 个字符被保留作特殊用途。他们是:
!"#$%&'()*
这些特殊字符也被称作元字符。
如果你想在正则表达式中将这些字符用作文本字符,你需要用反斜杠“"对其进行换码
)*。例如你想匹配“(+,正确的表达式为"(+
需要注意的是,(+也是有效的正则表达式。但它不会匹配“(+,
而会匹配“(+,中的“+。因为“(在这里表示特殊含义(重复 次到
多次)。
在编程语言中,要注意,一些特殊的字符会先被编译器处理,然后再传递给正则引擎。因
此正则表达式"(+在 ((中要写成“""(+。为了匹配“-".,你
要用正则表达式-"".。而在 ((中,正则表达式则变成了“-"""".。
/
不可显示字符
评论0