在python学习过程中,常常会遇到字符处理的函数sub(),下面就对这个函数进行学习。
一、函数理解
sub()函数是在re模块中,用于替换字符串中的匹配项。下面先从字面理解下re和sub的意思。
(1)re是正则表达式的意思,即英文Regular Expression的第一个字母缩写,正则表达式是用一种形式化语法描述的文本匹配模式。
(2)sub是substitute的简写,表示替换。那么,re.sub()函数就是根据正则表达式进行匹配,对命中的字符或字符串进行替换。
二、函数说明
re.sub(pattern, repl, string, count=0, flags=0)
参数介绍
pattern : 即正则表达式,用于匹配字符的模式表达。
repl : 替换的字符串,也可为一个函数。即对匹配的字符替换成的你需要的标记
string : 要被查找替换的原始字符串。
count:可选参数,表示要替换的最大次数,而且必须是非负整数,该参数默认为0,即所有的匹配都会替换;
flags:可选参数,表示编译时用的匹配模式(如忽略大小写、多行模式等),数字形式,默认为0。
三、使用举例
import re
text = "My phone number is 123456789"
result = re.sub(r'[0-9]', "*", text)
print(result)
输出结果为:
My phone number is *********
上述的例子就是对文本中0到9的任意一个数字替换为*。
这里主要是讲解了sub()函数,不过最为核心的知识点是在正则表达式上,也是很多初学者需要克服的拦路虎。