简介:RegEx或正则表达式是一系列用于创建搜索模式的字符。它可以用于检查字符串是否包含特定的搜索模式,同时也能进行字符串的替换和提取。本文将重点介绍Python正则表达式(RegEx)。1re模块(Module)Python内置了一个名为re的包,专门用于处理正则表达式。导入re模块:2Python中正则表达式(RegEx)导入re模块后,即可开始使用正则表达式:例如:搜索字符串以查看它是否以"The"开头并以"cjavapy"结尾:3re模块函数方法re模块提供了一组函数,帮助我们实现在字符串中搜索匹配项:4元字符(Metacharacters)元字符是具有特殊含义的字符:5特殊字符特殊字符是\,后跟下面列表中的字符之一,并具有特殊含义:6集合集合是在方括号[]中的一组字符,它们具有特殊含义:7findall()函数findall()函数返回包含所有匹配项的列表。例如:打印所有匹配项的列表:该列表按找到匹配项的顺序包含匹配项。如果找不到匹配项,则返回一个空列表:8search()函数search()函数搜索匹配的字符串,如果有匹配,则返回一个匹配对象。如果有多个匹配项,则仅返回匹配项的第一个匹配项:例如:搜索字符串中的第一个空格字符:如果找不到匹配项,则返回值None:9split()函数split()函数返回一个列表,其中字符串已分割在每个匹配处:例如:在每个空格字符处分割:可以通过指定maxsplit参数来控制出现次数:例如:仅在第一次出现时才拆分字符串:10sub()函数sub()函数用选择的文本替换匹配:例如:将每个空白字符替换为数字9:可以通过指定count参数来控制替换次数:例如:11Match 对象(Object)匹配对象是包含有关搜索和结果信息的对象。注意:如果没有匹配项,则将返回值None,而不是Match Object。例如:进行搜索以返回匹配对象:匹配对象具有用于检索有关搜索信息的属性和方法,以及结果:.span()返回一个包含匹配的开始和结束位置的元组。 .string返回传递给该函数的字符串 .group()返回字符串中存在匹配项的部分例如:打印第一个匹配项的位置(开始和结束位置)。 正则表达式查找以大写字母“C”开头的所有单词:例如:打印传递给函数的字符串:例如:打印匹配的字符串部分。 正则表达式查找以大写字母“C”开头的所有单词:注意:如果没有匹配项,则将返回值None,而不是Match Object。