模块7Python字符串与正则表达式.pptx
Python 字符串与正则表达式知识点总结 Python 字符串是 Python 编程语言中最基本的数据类型之一, Plays 一个重要的角色。字符串是用来表示文本信息的,可以是英文、中文、数字、符号等。在 Python 中,字符串可以使用单引号、双引号、三引号等多种方式来定义。 字符串编码 字符串编码是指将字符串转换为数字的过程,因为计算机只能处理数字。常见的字符串编码有 ASCII 码、GB2312 编码、Unicode 编码和 UTF-8 编码等。 * ASCII 码:美国标准信息交换码,仅对 10 个数字、26 个英文字母的大小写及一些常用符号进行了编码。采用 1 个字节来对字符进行编码,所以最多只能表示 256 个符号。 * GB2312 编码:中国制定的编码,用来把中文编进去。使用 1 个字节表示英文,2 个字节表示中文。 * Unicode 编码:把所有语言都统一到一套编码里,这样就不会再有乱码问题了。Unicode 标准也在不断发展,但最常用的是用两个字节表示一个字符。 * UTF-8 编码:把 Unicode 编码转化为“可变长编码”的 UTF-8 编码。UTF-8 编码把一个 Unicode 字符根据不同的数字大小编码成 1-6 个字节,常用的英文字母被编码成 1 个字节,汉字通常是 3 个字节,只有很生僻的字符才会被编码成 4-6 个字节。 转义字符 转义字符是指在字符串中使用的特殊字符,用于表示一些特殊的符号或操作。常见的转义字符有: * \a:蜂鸣器响铃 * \b:退格(Backspace 键),将光标位置移到前一列 * \f:换页符,将光标位置移到下一页开头 * \n:换行符,将光标位置移到下一行开头 * \r:回车符(Enter 键) * \t:水平制表符(Tab 键),一般相当于四个空格 * \v:垂直制表符 * \\:一个反斜线字符 * \':一个单引号字符 * \":一个双引号字符 * \o:八进制数表示的字符 * \x:十六进制数表示的字符 * \other:其他的字符以普通格式输出 * \:在字符串行尾的续行符,即一行未完,转到下一行继续写 原始字符串 原始字符串是指在字符串前面加上字母 r 或 R,以避免对字符串中的转义字符进行转义。在原始字符串中,所有字符都表示原始的含义而不会进行任何转义。 字符串格式化 字符串格式化是指将字符串与其他数据类型的值组合成一个新的字符串。Python 提供了多种字符串格式化的方法,包括使用 % 运算符、str.format() 方法和 f 字符串等。 * format 函数:Python2.6 开始,新增了一种字符串格式化的函数 format,它增强了字符串格式化的功能。format 函数基本使用格式是:<模板字符串>.format(<逗号分隔的参数>)。 字符串操作 字符串操作是指对字符串进行各种操作,例如字符串连接、字符串截取、字符串查找、字符串替换等。 * 字符串连接:使用 + 运算符或 str.join() 方法连接多个字符串 * 字符串截取:使用 [] 运算符或 str.slice() 方法截取字符串的一部分 * 字符串查找:使用 in 运算符或 str.find() 方法查找字符串中是否包含某个子串 * 字符串替换:使用 str.replace() 方法将字符串中的一部分替换为另一部分
剩余59页未读,继续阅读
- 粉丝: 0
- 资源: 2
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
评论0