第5章 字符串与正则表达式.pptx
Python 字符串与正则表达式 在 Python 中,字符串是一种基本的数据类型,用于存储和操作文本数据。字符串可以是 Unicode 码、UTF-8 码等多种编码方式。在本章节中,我们将介绍字符串的编码、索引、分片、连接操作、逻辑操作和正则表达式的应用。 5.1 字符串编码 Unicode 码是为表达全世界所有语言的任意字符而设计的编码标准,它使用 4 字节的数字编码来表达每个字母、符号或文字。每个数字编码代表唯一的至少在某种语言中使用的符号,被几种语言共用的字符通常使用相同的数字来编码,每个字符对应一个数字编码,每个数字编码对应一个字符,即不存在二义性。 UTF-8 码是 Unicode 码的变长编码系统,即不同的字符可使用不同数量的字节编码。对于 ASCII 字符,UTF-8 仅使用 1 个字节来编码。UTF-8 支持中英文编码,英文系统也可以显示中文。 Python 支持 UTF-8 编码,中文字符、希腊字母均可以作为标识符使用。 在 Python 中,可以通过字符串的 encode() 方法从 Unicode 编码为指定编码方式。decode() 方法从指定编码方式解码为 Unicode 方式。 5.2 字符串的索引与分片 字符串的索引是指对字符串中的字符进行编号,最左边字符编号为 0,最右边字符的编号比字符串的长度小 1。Python 还支持在字符串中使用负数从右向左进行编号,最右边的字符(即倒数第 1 个字符)的编号为 -1。 字符串变量名后接用中括号括起来的编号即可实现字符串的索引。例如,s="Hello",则 s[0] 的值为 'H',s[-1] 的值为 'o'。 5.2.1 字符串的索引 字符串的索引可以用来实现字符串的逆序打印。例如,输入一个字符串,并将其逆序打印出来。 5.2.2 字符串的分片 字符串的分片就是从给定的字符串中分离出部分字符。这时可以使用以下形式的字符串索引编号:i:j:k,其中 i 是索引起始位置,j 是索引结束位置但不包括 j 位置上的字符,索引编号每次增加的步长为 k。 例如,s="Hello World!",则 s[0:5:2] 的值为 'Hlo'。 5.3 字符串的操作 5.3.1 字符串连接操作 字符串连接操作可以用来连接多个字符串。Python 提供了基本连接操作和重复连接操作两种方式。 基本连接操作的格式是:s1+s2+……+sn,其中 s1,s2,……,sn 均是一个字符串,表达式的值也是一个字符串。 重复连接操作可以用乘法运算符(*)来实现。例如:"ABCD"*2 的值为 'ABCDABCD'。 5.3.2 字符串逻辑操作 字符串逻辑操作可以用来比较两个字符串的大小关系。Python 提供了多种字符串逻辑操作符,例如 >=、==、!= 等。 5.4 正则表达式的应用 正则表达式是一种强大的字符串模式匹配工具,通过使用特殊字符和语法来描述字符串的模式。Python 提供了 re 模块来支持正则表达式的应用。 在下一章节中,我们将继续介绍正则表达式的应用和 Python 的其他高级特性。
剩余49页未读,继续阅读
- 粉丝: 1
- 资源: 5
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助