验证正则表达式的小工具和华为内部文档资源-CSDN文库

共5个文件

pdf：2个

exe：1个

chm：1个

正则表达式

正则工具文档

华为内部文档

5星 · 超过95%的资源需积分: 10 84 浏览量 2013-07-11 18:40:16 上传评论收藏 698KB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

.rar （5个子文件）

正则表达式

正则表达式系统教程.CHM 42KB

正则表达式入门教程(pdf版).pdf 344KB

RegexTester.exe 388KB

regex.xml 4KB

正则表达式教程(免费).pdf 239KB

正则表达式 30

30 分钟入门教程

版本： v2.31 (2009-4-11) 作者： deerchao 转载请注明来源

跳过目录

1 本文目标

2 如何使用本教程

3 正则表达式到底是什么东西？

4 入门

5 测试正则表达式

6 元字符

7 字符转义

8 重复

9 字符类

10 分枝条件

11 反义

12 分组

13 后向引用

14 零宽断言

15 负向零宽断言

16 注释

17 贪婪与懒惰

18 处理选项

19 平衡组 / 递归匹配

20 还有些什么东西没提到

21 联系作者

22 最后 , 来点广告 ……

23 网上的资源及本文参考文献

24 更新纪录

本文目标

30 分钟内让你明白正则表达式是什么，并对它有一些基本的了解，让你可以在自

己的程序或网页里使用它。

如何使用本教程

最重要的是 —— 请给我 30

30 分钟，如果你没有使用正则表达式的经验，请不要试图

在 30 秒内入门 —— 除非你是超人 :)

别被下面那些复杂的表达式吓倒，只要跟着我一步一步来，你会发现正则表达式

其实并没有你想像中的那么困难。当然，如果你看完了这篇教程之后，发现自己明白

了很多，却又几乎什么都记不得，那也是很正常的 —— 我认为，没接触过正则表达式

的人在看完这篇教程后，能把提到过的语法记住 80% 以上的可能性为零。这里只是让

你明白基本的原理，以后你还需要多练习，多使用，才能熟练掌握正则表达式。

除了作为入门教程之外，本文还试图成为可以在日常工作中使用的正则表达式语

法参考手册。就作者本人的经历来说，这个目标还是完成得不错的 —— 你看，我自己

也没能把所有的东西记下来，不是吗？

清除格式文本格式约定：专业术语元字符 / 语法格式正则表达式正则表达式

中的一部分 ( 用于分析 )

对其进行匹配的源字符串

对正则表达式或其中一部分的说明

隐藏边注本文右边有一些注释，主要是用来提供一些相关信息，或者给没有程

序员背景的读者解释一些基本概念，通常可以忽略。

正则表达式到底是什么东西？

字符是计算机软件处理文字时最基本的单位，可能是字母，数字，标点符号，空

格，换行符，汉字等等。字符串是 0 个或更多个字符的序列。文本也就是文字，字符

串。说某个字符串匹配某个正则表达式，通常是指这个字符串里有一部分（或几部分

分别）能满足表达式给出的条件。

在编写处理字符串的程序或网页时，经常会有查找符合某些复杂规则的字符串的

需要。正则表达式就是用于描述这些规则的工具。换句话说，正则表达式就是记录文

本规则的代码。

很可能你使用过 Windows/Dos 下用于文件查找的通配符 (wildcard)

(wildcard)

，也就是

* 和 ?

。

如果你想查找某个目录下的所有的 Word 文档的话，你会搜索 *.doc 。在这里， * 会被

解释成任意的字符串。和通配符类似，正则表达式也是用来进行文本匹配的工具，只

不过比起通配符，它能更精确地描述你的需求 —— 当然，代价就是更复杂 —— 比如你

可以编写一个正则表达式，用来查找所有以 0 开头，后面跟着 2-3 个数字，然后是一个

连字号 “ - ” ，最后是 7 或 8 位数字的字符串 ( 像

010-12345678

或

0376-7654321

) 。

入门

学习正则表达式的最好方法是从例子开始，理解例子之后再自己对例子进行修

改，实验。下面给出了不少简单的例子，并对它们作了详细的说明。

假设你在一篇英文小说里查找 hi ，你可以使用正则表达式 hi 。

这几乎是最简单的正则表达式了，它可以精确匹配这样的字符串：由两个字符组

成，前一个字符是 h, 后一个是 i 。通常，处理正则表达式的工具会提供一个忽略大小

写的选项，如果选中了这个选项，它可以匹配

这四种情况中的任意一种。

不幸的是，很多单词里包含

这两个连续的字符，比如

him

history

high

等等。

用 hi 来查找的话，这里边的

也会被找出来。如果要精确地查找 hi 这个单词

的话，

我们应该使用 \bhi\b 。

\b 是正则表达式规定的一个特殊代码（好吧，某些人叫它

元字符，

metacharact

metacharact er

），

代表着单词的开头或结尾，也就是单词的分界处。虽然通常英文的单词是由空格，标

点符号或者换行来分隔的，但是 \b 并不匹配这些单词分隔字符中的任何一个，它只匹

配一个位置。

如果需要更精确的说法， \b 匹配这样的位置：它的前一个字符和后一个字符不全

是 ( 一个是 , 一个不是或不存在 ) \w 。

假如你要找的是 hi 后面不远处跟着一个 Lucy ，你应该用 \bhi\b.*\bLucy\b 。

这里， . 是另一个元字符，匹配除了换行符以外的任意字符。 * 同样是元字符，不

过它代表的不是字符，也不是位置，而是数量 —— 它指定 * 前边的内容可以连续重复

使用任意次以使整个表达式得到匹配。因此， .* 连在一起就意味着任意数量的不包含

换行的字符。现在 \bhi\b.*\bLucy\b 的意思就很明显了：先是一个单词 hi, 然后是任意

个任意字符 ( 但不能是换行 ) ，最后是 Lucy 这个单词。

换行符就是 '\n',ASCII 编码为 10( 十六进制 0x0A) 的字符。

如果同时使用其它元字符，我们就能构造出功能更强大的正则表达式。比如下面

这个例子：

0\d\d-\d\d\d\d\d\d\d\d 匹配这样的字符串：以 0 开头，然后是两个数字，然后是一

个连字号 “ - ” ，最后是 8 个数字 ( 也就是中国的电话号码。当然，这个例子只能匹配区号

为 3 位的情形 ) 。

这里的 \d 是个新的元字符，匹配一位数字 (0 ，或 1 ，或 2 ，或 …… )

。

- 不是元字符

，

只匹配它本身 —— 连字符 ( 或者减号，或者中横线，或者随你怎么称呼它 ) 。

为了避免那么多烦人的重复，我们也可以这样写这个表达式： 0\d{2}-\d{8}

。

这

里 \d 后面的 {2} ( {8} ) 的意思是前面 \d 必须连续重复匹配 2 次 (8 次 ) 。

测试正则表达式

其它可用的测试工具 :

•

RegexBuddy

•

Javascript 正则表达式在线测试工具

如果你不觉得正则表达式很难读写的话，要么你是一个天才，要么，你不是地球

人。正则表达式的语法很令人头疼，即使对经常使用它的人来说也是如此。由于难于

读写，容易出错，所以找一种工具对正则表达式进行测试是很有必要的。

不同的环境下正则表达式的一些细节是不相同的，本教程介绍的是微软 .Net

Framework 2.0 下正则表达式的行为，所以，我向你介绍一个 .Net 下的工具 Regex

Tester 。首先你确保已经安装了 .Net Framework 2.0 ，然后下载 Regex Tester 。这是个绿

色软件，下载完后打开压缩包 , 直接运行 RegexTester.exe 就可以了。

下面是 Regex Tester 运行时的截图：

元字符

现在你已经知道几个很有用的元字符了，如 \b , .

，还有

\d . 正则表达式里还有更多

的元字符，比如 \s 匹配任意的空白符，包括空格，制表符 (Tab) ，换行符，中文全角空

格等。 \w 匹配字母或数字或下划线或汉字等。

对中文 / 汉字的特殊处理是由 .Net 提供的正则表达式引擎支持的，其它环境下的

具体情况请查看相关文档。

下面来看看更多的例子：

\ba\w*\b 匹配以字母 a 开头的单词 —— 先是某个单词开始处 ( \b ) ，然后是字母 a ,

然后是任意数量的字母或数字 ( \w* ) ，最后是单词结束处 ( \b ) 。

好吧，现在我们说说正则表达式里的单词是什么意思吧：就是不少于一个的连续

的 \w 。不错，这与学习英文时要背的成千上万个同名的东西的确关系不大 :)

\d+ 匹配 1 个或更多连续的数字。这里的 + 是和 * 类似的元字符，不同的是 * 匹配重

复任意次 ( 可能是 0 次 ) ，而 + 则匹配重复 1 次或更多次。

\b\w{6}\b 匹配刚好 6 个字符的单词。

正则表达式引擎通常会提供一个 “ 测试指定的字符串是否匹配一个正则表达式 ”

的方法，如 JavaScript 里的 RegExp.test() 方法或 .NET 里的 Regex.IsMatch() 方法。这里

的匹配是指是字符串里有没有符合表达式规则的部分。如果不使用 ^ 和 $ 的话，对于

\d{5,12} 而言，使用这样的方法就只能保证字符串里包含 5 到 12 连续位数字，而不是整

个字符串就是 5 到 12 位数字。

元字符 ^ （和数字 6 在同一个键位上的符号）和 $ 都匹配一个位置，这和 \b 有点类

似。 ^ 匹配你要用来查找的字符串的开头， $ 匹配结尾。这两个代码在验证输入的内容

时非常有用，比如一个网站如果要求你填写的 QQ 号必须为 5 位到 12 位数字时，可以

表 1.

1. 常用的元字符代码

说明

匹配除换行符以外的任意字符

匹配字母或数字或下划线或汉字

匹配任意的空白符

匹配数字

匹配单词的开始或结束

匹配字符串的开始

匹配字符串的结束

评论收藏

内容反馈

英迈斯

2013-08-28

挺好使的一个小工具！不错！
tyr32167

2013-09-03

很不错的资源

谈晓鸣

粉丝: 16
资源: 31

验证正则表达式的小工具和华为内部文档

面试笔试常考之正则表达式和模式匹配

正则表达式教程

一道华为笔试题，带大家深入掌握一项 Python 技巧：正则表达式

华为内部java考题

WEB开发必备几乎包含所有参考资料

华为AR系列路由命令参考

华为出品-Python基础入门教程-可爱的Python 共86页.ppt

华为自动化培训视频.rar

HCIA-AI华为AI工程师视频.zip

华为HCNA-AI V1.0 LVC培训视频.zip

华为HCIA-AI V1.0 LVC公开课培训视频.rar

grafana——zabbix交换机模板

华为HCIA-AI培训视频教程【共40集】.rar

华为杯作品 聊天机器人 LDA word2vec jieba 正则与编码相关问题解决.zip

华为HCIA人工智能试题.docx

华为笔试题java-potential-disco:网页浏览

基于Java和CNN网络实现垃圾识别分类安卓APP源码+项目说明文档.zip

Excel操作.zip

传智播客.net24期(全套就业班)全套视频和资料百度云盘分享

Visual Studio 2019 官方使用教程

FastReport.NET中文用户手册2019.pdf

DotNetty系列六：将服务端和客户端改为Winform窗口,博文项目源码

Revit导出JSON数据源代码

WPF HelixToolkitWPF 中文手册 HelixToolkitWPF中文手册.pdf

Teigha (ODA) SDK 4.2官方文档 以及使用示例

数据库课程设计（终极版）.zip

C#通过NModBus读取modbus设备上的温湿度

吉林大学软件学院计算机网络实验代码和报告.zip

Autodesk Revit二次开发基础教程pdf.pdf

最新资源

华为杯作品聊天机器人 LDA word2vec jieba 正则与编码相关问题解决.zip

Teigha (ODA) SDK 4.2官方文档以及使用示例