没有合适的资源?快使用搜索试试~ 我知道了~
php正则表达式深入浅出.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 88 浏览量
2023-09-22
21:44:34
上传
评论
收藏 48KB DOCX 举报
温馨提示
试读
15页
php正则表达式深入浅出
资源推荐
资源详情
资源评论
1.
什么是正则表达式..................................................................................................2
2.
不同的正则表达式引擎..........................................................................................2
3.
文字符号..................................................................................................................2
4.
正则表达式引擎的内部工作机制..........................................................................3
5.
字符集......................................................................................................................4
6.
使用?*或+ 进行重复 .............................................................................................5
7.
使用“.”匹配几乎任意字符.................................................................................7
8.
字符串开始和结束的锚定......................................................................................8
9.
单词边界..................................................................................................................9
10.
选择符........................................................................................................................9
11.
组与向后引用..........................................................................................................10
12.
正则表达式的匹配模式..........................................................................................11
13.
原子组与防止回溯..................................................................................................12
14.
向前查看与向后查看..............................................................................................12
15.
正则表达式中的条件测试......................................................................................14
16.
为正则表达式添加注释..........................................................................................15
深入浅出之正则表达式
前言:
半年前我对正则表达式产生了兴趣,在网上查找过不少资料,看过不少
的教程,最后在使用一个正则表达式工具RegexBuddy 时发现他的教程写的非常
好,可以说是我目前见过最好的正则表达式教程。于是一直想把他翻译过来。这
个愿望直到这个五一长假才得以实现,结果就有了这篇文章。关于本文的名字,
使用“深入浅出”似乎已经太俗。但是通读原文以后,觉得只有用“深入浅出”
才能准确的表达出该教程给我的感受,所以也就不能免俗了。
本文是Jan Goyvaerts 为RegexBuddy 写的教程的译文,版权归原作者所
有,欢迎转载。但是为了尊重原作者和译者的劳动,请注明出处!谢谢!
1.
什么是正则表达式
基本说来,正则表达式是一种用来描述一定数量文本的模式。Regex 代表
Regular Express。本文将用<<regex>>来表示一段具体的正则表达式。
一段文本就是最基本的模式,简单的匹配相同的文本。
2.
不同的正则表达式引擎
正则表达式引擎是一种可以处理正则表达式的软件。通常,引擎是更大的应
用程序的一部分。在软件世界,不同的正则表达式并不互相兼容。本教程会集中
讨 论 Perl 5 类型的引擎,因为这种引擎是应用最广泛的引擎。同时我们也会提
到一些和其他引擎的区别。许多近代的引擎都很类似,但不完全一样。例如.NET
正则库,JDK 正则包。
3.
文字符号
最基本的正则表达式由单个文字符号组成。如<<a>>,它将匹配字符串中第一
次出现的字符“a”。如对字符串“Jack is a boy”。“J”后的“a”将被匹配。
而第二个“a”将不会被匹配。
正则表达式也可以匹配第二个“a”,这必须是你告诉正则表达式引擎从第一
次匹配的地方开始搜索。在文本编辑器中,你可以使用“查找下一个”。在编程
语言中,会有一个函数可以使你从前一次匹配的位置开始继续向后搜索。
类似的,<<cat>>会匹配“About cats and dogs”中的“cat”。这等于是告
诉正则表达式引擎,找到一个<<c>>,紧跟一个<<a>>,再跟一个<<t>>。
要注意,正则表达式引擎缺省是大小写敏感的。除非你告诉引擎忽略大小写,
否则<<cat>>不会匹配“Cat”。
�
特殊字符
对于文字字符,有 11 个字符被保留作特殊用途。他们是:
[ ] \ ^ $ . | ? * + ( )
这些特殊字符也被称作元字符。
如果你想在正则表达式中将这些字符用作文本字符,你需要用反斜杠“\”
对其进行换码 (escape)。例如你想匹配“1+1=2”,正确的表达式为<<1\+1=2>>.
需要注意的是,<<1+1=2>>也是有效的正则表达式。但它不会匹配“1+1=2”,
而会匹配“123+111=234”中的“111=2”。因为“+”在这里表示特殊含义(重复
1 次到多次)。
在编程语言中,要注意,一些特殊的字符会先被编译器处理,然后再传递给
正则引擎。因此正则表达式<<1\+2=2>>在 C++中要写成“1\\+1=2”。为了匹配
“C:\temp”,你要用正则表达式<<C:\\temp>>。而在C++中,正则表达式则变
成了“C:\\\\temp”。
�
不可显示字符
可以使用特殊字符序列来代表某些不可显示字符:
<<\t>>代表Tab(0x09)
<<\r>>代表回车符(0x0D)
<<\n>>代表换行符(0x0A)
要注意的是Windows 中文本文件使用“\r\n”来结束一行而 Unix 使用“\n”。
4.
正则表达式引擎的内部工作机制
知道正则表达式引擎是如何工作的有助于你很快理解为何某个正则表达式不
像你期望的那样工作。
有两种类型的引擎:文本导向(text-directed)的引擎和正则导向
(regex-directed)的引擎。Jeffrey Friedl 把他们称作DFA 和NFA 引擎。本文
谈到的是正则导向的引擎。这是因为一些非常有用的特性,如“惰性”量词(lazy
quantifiers)和反向引用(backreferences),只能在正则导向的引擎中实现。所
以毫不意外这种引擎是目前最流行的引擎。
你可以轻易分辨出所使用的引擎是文本导向还是正则导向。如果反向引用或
“惰性”量词被实现,则可以肯定你使用的引擎是正则导向的。你可以作如下测
试:将正则表达式<<regex|regex not>>应用到字符串“regex not”。如果匹配
的结果是regex,则引擎是正则导向的。如果结果是regex not,则是文本导向
的。因为正则导向的引擎是“猴急”的,它会很急切的进行表功,报告它找到的
第一个匹配 。
�
正则导向的引擎总是返回最左边的匹配
这是需要你理解的很重要的一点:即使以后有可能发现一个“更好”的匹配,
正则导向的引擎也总是返回最左边的匹配。
剩余14页未读,继续阅读
资源评论
小小哭包
- 粉丝: 1899
- 资源: 3854
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 农村信用社联合社计算机信息系统投产与变更管理办.docx
- 农村信用社联合社计算机信息系统数据管理办法.docx
- 利用SPSS作临床效度分析线上计算网站介绍-医学研究部统计谘.(医学PPT课件).ppt
- 利用Zabbix监控mysqldump定时备份数据库状态.docx
- 利用计算机解决问题的基本过程.doc
- 化工铁路通信工程总结.doc
- 北京大学网络教育软件工程作业.docx
- 医药公司(连锁店)计算机操作规程未新系统的自行按照旧制修改-新系统过制的编号加修模版.doc
- 医药公司(连锁店)计算机系统操作规程模版.doc
- 医药连锁门店计算机系统的操作和管理程序未新系统的自行按照旧制修改-新系统过制的编号加修模版.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功