2024-04-04 08:41:48
在Excel或WPS中,若要同时提取文本中的字母和数字,可使用REGEXEXTRACT(Excel)或REGEXP(WPS)函数结合正则表达式[a-zA-Z0-9]+实现。
正则表达式解析基础字符匹配
d:匹配任意数字(0-9),+表示匹配前一个字符一次或多次,因此d+可提取连续数字(如123)。
[a-z]:匹配小写字母,[A-Z]匹配大写字母。若需不区分大小写,可在函数参数中设置(如WPS的REGEXP第四参数设为1)。
组合匹配字母和数字
正则表达式[a-zA-Z0-9]+表示匹配一个或多个连续的字母(大小写均可)或数字。例如:
文本"abc123"会提取为"abc123";
文本"A1B2C3"会提取为"A1B2C3";
若文本中包含符号(如"a-b#1"),则仅提取"a1"(从第一个字母或数字开始连续匹配)。
Excel中的REGEXEXTRACT
语法:=REGEXEXTRACT(text, "[a-zA-Z0-9]+")
参数说明:
text:待提取的单元格或文本字符串;
"[a-zA-Z0-9]+":正则表达式,匹配连续字母和数字;
无需额外参数即可实现基础匹配。
WPS中的REGEXP
语法:=REGEXP(text, "[a-zA-Z0-9]+", 0, 0)
参数说明:
前两个参数与Excel相同;
第三个参数(返回模式):通常设为0(返回第一个匹配项);
第四个参数(大小写敏感):设为0区分大小写,1不区分大小写。
通过上述方法,可高效提取文本中的字母和数字组合,适用于数据清洗、编码解析等场景。