Python语法基础-正则表达式

发表于 2021-10-31 更新于 2026-04-20 分类于 python

Python语法基础-正则表达式

正则表达式

re 模块提供了一组函数，允许我们检索字符串以进行匹配：

函数	描述
`findall`	返回包含所有匹配项的列表
`search`	如果字符串中的任意位置存在匹配，则返回 Match 对象
`split`	返回在每次匹配时拆分字符串的列表
`sub`	用字符串替换一个或多个匹配项

元字符是具有特殊含义的字符：

特殊序列指的是 \ 后跟下表中的某个字符，拥有特殊含义：

字符	描述	示例
`\A`	如果指定的字符位于字符串的开头，则返回匹配项	“\AThe”
`\b`	返回指定字符位于单词的开头或末尾的匹配项	r”\bain” r”ain\b”
`\B`	返回指定字符存在的匹配项，但不在单词的开头（或结尾处）	r”\Bain” r”ain\B”
`\d`	返回字符串包含数字的匹配项（数字 0-9）	“\d”
`\D`	返回字符串不包含数字的匹配项	“\D”
`\s`	返回字符串包含空白字符的匹配项	“\s”
`\S`	返回字符串不包含空白字符的匹配项	“\S”
`\w`	返回一个匹配项，其中字符串包含任何单词字符（从 a 到 Z 的字符，从 0 到 9 的数字和下划线 _ 字符）	“\w”
`\W`	返回一个匹配项，其中字符串不包含任何单词字符	“\W”
`\Z`	如果指定的字符位于字符串的末尾，则返回匹配项	“Spain\Z”

集合（Set）是一对方括号 [] 内的一组字符，具有特殊含义：

集合	描述
`[arn]`	返回一个匹配项，其中存在指定字符（a，r 或 n）之一
`[a-n]`	返回字母顺序 a 和 n 之间的任意小写字符匹配项
`[^arn]`	返回除 a、r 和 n 之外的任意字符的匹配项
`[0123]`	返回存在任何指定数字（0、1、2 或 3）的匹配项
`[0-9]`	返回 0 与 9 之间任意数字的匹配
`[0-5][0-9]`	返回介于 0 到 9 之间的任何数字的匹配项
`[a-zA-Z]`	返回字母顺序 a 和 z 之间的任何字符的匹配，小写或大写
`[+]`	在集合中，+、*、.、\|、()、$、{} 没有特殊含义，因此 [+] 表示：返回字符串中任何 + 字符的匹配项

检索字符串以查看它是否以 “China” 开头并以 “country” 结尾：

import re

txt = "China is a great country"
x = re.search("^China.*country$", txt)