正则表达式 30 分钟入门教程
文本格式约定:专业术语元字符/语法格式正则表达式正则表达式中的一部分(用于分
析)
用于在其中搜索的字符串
对正则表达式或其中一部分的说明 清除格式
正则表达式到底是什么?
在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则的字符串的需要。
正则表达式就是用于描述这些规则的工具。换句话说,正则表达式就是记录文本规则的代码。
很可能你使用过 Windows/Dos 下用于文件查找的通配符(wildcard),也就是*和?。
如果你想查找某个目录下的所有的 Word 文档的话,你会搜索*.doc。在这里,*会被解释
成任意的字符串。和通配符类似,正则表达式也是用来进行文本 匹配 的工具,只不过比起通
配符,它能更精确地描述你的需求——当然,代价就是更复杂——比如你可以编写一个正则
表达式,用来查找所有以
个数字,然后是一个连字号“ -” ,最后是
位数字的字符串 (像 010-12345678 或 0376-7654321)。
正则表达式是用于进行文本匹配的工具,所以本文里多次提到了在字符串里搜索/查找,
这种说法的意思是在给定的字符串中,寻找与给定的正则表达式相匹配的部分。有可能字符
串里有不止一个部分满足给定的正则表达式,这时每一个这样的部分被称为一个匹配。匹配
在本文里可能会有三种意思:一种是形容词性的,比如说一个字符串匹配一个表达式;一种
是动词性的,比如说在字符串里匹配正则表达式;还有一种是名词性的,就是刚刚说到的
“字符串中满足给定的正则表达式的一部分”。
入门
学习正则表达式的最好方法是从例子开始,理解例子之后再自己对例子进行修改,实
验。下面给出了不少简单的例子,并对它们作了详细的说明。
假设你在一篇英文小说里查找 hi,你可以使用正则正则表达式 hi。
这是最简单的正则表达式了,它可以精确匹配这样的字符串:由两个字符组成,前一
个字符是
i。通常,处理正则表达式的工具会提供一个忽略大小写的选项,如果
选中了这个选项,它可以匹配 hi,HI,Hi,hI 这四种情况中的任意一种。
不幸的是,很多单词里包含 hi 这两个连续的字符,比如 him,history,high 等等。用
hi 来查找的话,这里边的 hi 也会被找出来。如果要精确地查找
评论0
最新资源