Python入门【原生字符串、边界字符、search函数、re模块中其他常用的函数 、贪婪模式和非贪婪模式、择一匹配(|)的使用、分组】(三十)

👏作者简介:大家好,我是爱敲代码的小王,CSDN博客博主,Python小白
📕系列专栏:python入门到实战、Python爬虫开发、Python办公自动化、Python数据分析、Python前后端开发
📧如果文章知识点有错误的地方,请指正!和大家一起学习,一起进步👀
🔥如果感觉博主的文章还不错的话,请👍三连支持👍一下博主哦
🍂博主正在努力完成2023计划中:以梦为马,扬帆起航,2023追梦人

🔥🔥🔥 python入门到实战专栏:从入门到实战 

🔥🔥🔥 Python爬虫开发专栏:从入门到实战

🔥🔥🔥 Python办公自动化专栏:从入门到实战

🔥🔥🔥 Python数据分析专栏:从入门到实战

🔥🔥🔥 Python前后端开发专栏:从入门到实战

目录

原生字符串

边界字符

search函数

择一匹配(|)的使用

分组

re模块中其他常用的函数 

sub和subn搜索与替换

compile 函数

findall 函数

finditer函数 

split函数

贪婪模式和非贪婪模式


原生字符串

 和大多数编程语言相同,正则表达式里使用“\”作为转义字符,这就可以能造成反斜杠困扰。

 【示例】“\”作为转义字符

sxiao = 'c:\\a\\b\\c'
print(sxiao )sxiao = '\n123'
print(sxiao )sxiao = '\\n123'
print(sxiao )

假如你需要匹配文本中的字符“\”,那么使用编程语言表示的正则表 达式里将需要4个反斜杠“\\”:前面两个和后两个分别用于在编程语言里转义成反斜杠,转换成两个反斜杠后再在正则表达式里转义成 一个反斜杠。

Python里的原生字符串很好地解决了这个问题,使用Python的r前 缀。例如匹配一个数字的“\d”可以写成r“\d”。有了原生字符串,再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观。

 【示例】Python中的r前缀的使用

import re
sxiao = r'\n123'
print(sxiao )#目标字符串
sxiao = '\\n123'
pattern = '\\n\d{3}'
print(re.match(pattern,sxiao)) #返回None#如果想匹配两个反斜杠需要使用两个反斜杠作为转义,即正则中要写四个反斜杠
pattern = '\\\\n\d{3}'
print(re.match(pattern,sxiao))#使用原生字符串r比较方便
pattern = r'\\n\d{3}'
print(re.match(pattern,sxiao))

边界字符

 注意:

1、^[ ^m ] 中的“^”的含义并不相同,后者“^”表示“除了….”的意思

【示例】匹配符$的使用 

import re
#匹配qq邮箱, 5-10位
print('未限制结尾'.center(30,'-'))
pattern = '[\d]{5,10}@qq.com'
print('正确的邮箱匹配结果:\n',re.match(pattern,'2423@qq.com'))
print('不正确的邮箱匹配结果:\n',re.match(pattern,'2423@qq.comabc'))
print('限制结尾'.center(30,'-'))
pattern = '[1-9]\d{4,9}@qq.com$'
print('正确的邮箱匹配结果:\n',re.match(pattern,'2423@qq.com'))
print('不正确的邮箱匹配结果:\n',re.match(pattern,'2423@qq.comabc'))

【示例】匹配符^的使用

import re
sxiao='hello python'
pattern=r'^hello.*'
print('匹配字符串hello python的结果:\n',re.match(pattern,sxiao))sxiao='hepython'
pattern=r'^hello.*'
print('匹配字符串hepython的结果:\n',re.match(pattern,sxiao))

【示例】\b 匹配单词边界

pattern = r'.*\bab'
#ab左边界的情况
vxiao = re.match(pattern,'123 abr')
print(vxiao )
pattern = r'.*ab\b'#ab为右边界的情况
vxiao = re.match(pattern,'wab')
print(vxiao )

【示例】\B 匹配非单词边界

#ab不为左边界
pattern = r'.*\Bab'
vxiao = re.match(pattern,'123 abr')
print(vxiao)#ab不为右边界
pattern = r'.*ab\B'
vxiao= re.match(pattern,'wab')
print(vxiao)

search函数

search在一个字符串中搜索满足文本模式的字符串。

语法格式如下: 

re.search(pattern, string, flags=0)

函数参数与match类似

参数描述
pattern匹配的正则表达式
string要匹配的字符串。
flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。如下表列出正则表达式修饰符 - 可选标志

【示例】search函数的使用 

import re
mxiao=re.search('abc','abcdefg')
print(mxiao)
print(mxiao.group())

match与search的区别

re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串, 直到找到一个匹配。

【示例】match方法与search方法的使用对比

import re
#进行文本模式匹配,匹配失败,match方法返回None
mxiao=re.match('love','I love you')
if mxiaois not None:print(mxiao.group())
print('match运行结果:',mxiao)#进行文本模式搜索,
mxiao=re.search('love','I love you')
if mxiaois not None:print(mxiao.group())
print('search的运行结果:',mxiao)

择一匹配(|)的使用

search方法搜索一个字符串,要想搜索多个字符串,如搜索aa、bb 和cc,最简单的方法是在文本模式字符串中使用择一匹配符号 (|)。择一匹配符号和逻辑或类似,只要满足任何一个,就算匹配 成功。

【示例】择一匹配符号(|)的使用 

import re
sxiao='aa|bb|cc'
#match进行匹配
mxiao=re.match(sxiao,'aa')   #aa满足要求,匹配成功
print(mxiao.group())mxiao=re.match(sxiao,'bb')   #bb满足要求,匹配成功
print(mxiao.group())#search查找
mxiao=re.search(sxiao,'Where is cc')
print(mxiao.group())

【示例】匹配0-100之间所有的数字

import re
pattern = '[1-9]?\d$|100$'
print(re.match(pattern,'0'))
print(re.match(pattern,'10'))
print(re.match(pattern,'100'))
print(re.match(pattern,'99'))
print(re.match(pattern,'200'))

如果待匹配的字符串中,某些字符可以有多个选择,就需要使用字符集([]),也就是一对中括号括起来的字符串。例如,[xyz]表示 x、y、z三个字符可以取其中任何一个,相当于“x|y|z”,所以对单个字符使用或关系时,字符集和择一匹配符的效果是一样的。

示例如下:

【示例】字符集([])和择一匹配符(|)完成相同的效果

import  re
mxiao=re.match('[xyz]','x')  #匹配成功
print(mxiao.group())mxiao=re.match('x|y|z','x')  #匹配成功
print(mxiao.group())

【示例】字符集([])和择一匹配符(|)的用法,及它们的差异

import re#匹配以第1个字母是a或者b,第2个字母是c或者d,如ac、bc、ad、bd
mxiao =re.match('[ab][cd]','aceg')
print(mxiao)#匹配以ab开头,第3个字母是c或者d,如abc、abd
mxiao =re.match('ab[cd]','abcd')
print(mxiao)#匹配ab或者cd
mxiao =re.match('ab|cd','cd')
print(mxiao)

分组

如果一个模式字符串中有用一对圆括号括起来的部分,那么这部分就会作为一组,可以通过group方法的参数获取指定的组匹配的字符串。当然,如果模式字符串中没有任何用圆括号括起来的部分, 那么就不会对待匹配的字符串进行分组。 

【示例】匹配座机号码 

pattern = r'(\d+)-(\d{5,8}$)'
vxiao = re.match(pattern,'010-66668888')
print(vxiao)
print(vxiao.group())
print(vxiao.group(1))
print(vxiao.group(2))
print(vxiao.groups())
print(vxiao.groups()[0])
print(vxiao.groups()[1])

【示例】\num 的使用

import re#匹配合法的网页标签
sxiao = '<html><title>我是标题</title></html>'
#匹配不合法的网页标签
ssxiao = '<html><title>我是标题</html></title>'
#优化前
pattern = r'<.+><.+>.+</.+></.+>'
print(re.match(pattern,sxiao))
print(re.match(pattern,ssxiao))#优化后 可以使用分组 \2 表示引用第2个分组 \1表示
引用第1个分组
pattern = r'<(.+)><(.+)>.+</\2></\1>'
print(re.match(pattern,sxiao))
print(re.match(pattern,ssxiao))

【示例】?P (?P=起好的别名)

sxiao = '<html><h1>我是一号字体</h1></html>'
# pattern = r'<(.+)><(.+)>.+</\2></\1>'
#如果分组比较多的话,数起来比较麻烦,可以使用起别名的方法?P<要起的名字> 以及使用别名(?P=之前起的别名)
pattern = r'<(?P<key1>.+)><(?P<key2>.+)>.+</(?P=key2)></(?P=key1)>'
vxiao = re.match(pattern,sxiao)
print(vxiao )

使用分组要了解如下几点:

1、只有圆括号括起来的部分才算一组,如果模式字符串中既有圆括号括起来的部分,也有没有被圆括号括起来的部分,那么只会将被圆括号括起来的部分算作一组,其它的部分忽略。

2、用group方法获取指定组的值时,组从1开始,也就是说,group(1)获取第1组的值,group(2)获取第2组的值,以此类推。

3、groups方法用于获取所有组的值,以元组形式返回。所以除了使用group(1)获取第1组的值外,还 可以使用groups()[0]获取第1组的值。获取第2组以及其它组的值的方式类似。

re模块中其他常用的函数 

sub和subn搜索与替换

sub函数和subn函数用于实现搜索和替换功能。这两个函数的功能几乎完全相同,都是将某个字符串中所有匹配正则表达式的部分替 换成其他字符串。用来替换的部分可能是一个字符串,也可以是一个函数,该函数返回一个用来替换的字符串。sub函数返回替换后的结果,subn函数返回一个元组,元组的第1个元素是替换后的结 果,第2个元素是替换的总数。

语法格式如下:

re.sub(pattern, repl, string, count=0,flags=0)
参数描述
pattern匹配的正则表达式
repl替换的字符串,也可为一个函数
string要被查找替换的原始字符串。
count模式匹配后替换的最大次数,默认 0 表示替换所有的匹配

【示例】sub和subn方法的使用

import re
phone = "2004-959-559 # 这是一个国外电话号码"# 删除字符串中的 Python注释
numtong = re.sub(r'#.*$', "", phone)
print("电话号码是: ", numtong )# 删除非数字(-)的字符串
numtong = re.sub(r'\D', "", phone)
print("电话号码是 : ", numtong )#subn函数的使用
result=re.subn(r'\D', "", phone)
print(result)print('替换的结果:',result[0])
print('替换的次数:',result[1])

compile 函数

compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供 match() 和 search() 这两个函数使用。语法格式为:

 re.compile(pattern[, flags])
参数描述
pattern一个字符串形式的正则表达式
flags可选,表示匹配模式,比如忽略大小写,多行模式等,

【示例】compile 函数的使用 

import resxiao='first123 line'
regex=re.compile(r'\w+') #匹配至少一个字母或数字
mtong=regex.match(sxiao)
print(mtong.group())# s 的开头是 "f", 但正则中限制了开始为 i 所以匹配失败
regex = re.compile("^i\w+")
print(regex.match(sxiao))

findall 函数

在字符串中找到正则表达式所匹配的所有子串,并返回一个列表, 如果没有找到匹配的,则返回空列表。语法格式如下:

findall(pattern, string, flags=0)
参数描述
pattern匹配的正则表达式
string要匹配的字符串。
flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。如下表列出正则表达式修饰符 - 可选标志

【示例】findall 函数的使用

import re
pattern=r'\w+'
sxiao='first 1 second 2 third 3'
otong=re.findall(pattern,sxiao)
print(otong)

注意:

matchsearch 是匹配一次 findall 匹配所有

finditer函数 

和 findall 类似,在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。

【示例】finditer函数的使用 

pattern=r'\w+'
sxiao='first 1 second 2 third 3'
otong=re.finditer(pattern,sxiao)
print(otong)
for i in otong:print(i.group())

split函数

split函数用于根据正则表达式分隔字符串,也就是说,将字符串与模式匹配的子字符串都作为分隔符来分隔这个字符串。split函数返回一个列表形式的分隔结果,每一个列表元素都是分隔的子字符 串。

语法格式如下:

re.split(pattern, string[, maxsplit=0,flags=0])
参数描述
pattern匹配的正则表达式
string要匹配的字符串。
maxsplit分隔次数,maxsplit=1 分隔一次,默认为 0,不限制次数。
flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。

【示例】split函数的使用

import re
stong='first 11 second 22 third 33'
#按数字切分
print(re.split(r'\d+',stong))
# maxsplit 参数限定分隔的次数,这里限定为1,也就是只分隔一次
print(re.split(r'\d+',stong,1))

贪婪模式和非贪婪模式

 贪婪模式指Python里数量词默认是贪婪的,总是尝试匹配尽可能多的字符。非贪婪模式与贪婪相反,总是尝试匹配尽可能少的字符, 可以使用"*","?","+","{m,n}"后面加上?,使贪婪变成非贪婪。

 【示例】贪婪模式,.+中的'.'会尽量多的匹配

vtong = re.match(r'(.+)(\d+-\d+-\d+)','This is my tel:133-1234-1234')print('----------贪婪模式---------')
print(vtong .group(1))
print(vtong .group(2))print('----------非贪婪模式---------')
vtong = re.match(r'(.+?)(\d+-\d+-\d+)','This is my tel:133-1234-1234')
print(vtong .group(1))
print(vtong .group(2))

【示例】贪婪模式非贪婪模式测试

print('贪婪模式')
vtong= re.match(r'abc(\d+)','abc123')
print(vtong.group(1))#非贪婪模式
print('非贪婪模式')
vtong= re.match(r'abc(\d+?)','abc123')
print(vtong.group(1))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/102509.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【算法系列篇】二分查找——这还是你所知道的二分查找算法吗?

文章目录 前言什么是二分查找算法1.二分查找1.1 题目要求1.2 做题思路1.3 Java代码实现 2.在排序数组中查找元素的第一个和最后一个位置2.1 题目要求2.2 做题思路2.3 Java代码实现 3.搜索插入位置3.1 题目要求3.2 做题思路3.3 Java代码实现 4.x的平方根4.1 题目要求4.2 做题思路…

锚定医学营养 健启星深耕不辍

在生命医学中&#xff0c;营养被称为维持患者生命的物质基础。医学营养&#xff0c;是结合了医学临床营养、营养素与疾病预防等方面&#xff0c;并根据患者的医疗记录、身体检查及心理情况&#xff0c;由医生及专业营养师给出配比完善的营养素&#xff0c;以此来增加患者身体的…

控制台实现家庭记账本功能

需求&#xff1a; 在控制台实现家庭记账本的小功能&#xff0c;功能如下 参考代码如下&#xff1a; import java.util.Scanner;/*** <p>家庭账本-综合案例</p>** author 波波老师(weixin : javabobo0513)*/ public class Demo24 {public static void main(Strin…

docker之Compose与DockerSwarm

目录 Compose 简介 概念 为什么需要&#xff1f; 配置字段 常用命令 安装 1.下载 2.授权 使用 1.创建文件 2.启动 docker Swarm 关键概念 调度策略 spread binpack random 特性 集群部署 1.准备 2.创建swarm并添加节点 在主服务器上创建swarm集群 节点…

OpenCV中QR二维码的生成与识别(CIS摄像头解析)

1、QR概述 QR(Quick Response)属于二维条码的一种&#xff0c;意思是快速响应的意思。QR码不仅信息容量大、可靠性高、成本低&#xff0c;还可表示汉字及图像等多种文字信息、其保密防伪性强而且使用非常方便。更重要的是QR码这项技术是开源的&#xff0c;在移动支付、电影票、…

分布式锁 总结

分布式锁 在应用开发中&#xff0c;特别是web工程开发&#xff0c;通常都是并发编程&#xff0c;不是多进程就是多线程。这种场景下极易出现线程并发性安全问题&#xff0c;此时不得不使用锁来解决问题。在多线程高并发场景下&#xff0c;为了保证资源的线程安全问题&#xff0…

深度学习基础

文章目录 1. 数学基础1.1 标量和向量1.2 向量运算1.3 矩阵1.4 张量1.5 导数 2. numpy常用操作3. 梯度下降算法4. 反向传播4.1 完整的反向传播过程4.2 代码演示 5. 网络结构 -- 全连接层6. 激活函数6.1 激活函数-Sigmoid6.2 激活函数-tanh6.3 激活函数-Relu6.4 激活函数-Softmax…

Linux权限

Linux中一切皆文件&#xff0c;那么文件就应该有相对于的类型&#xff0c;而在Linux当中&#xff0c;类型不是直接看后缀来决定的。 -普通文件、文本、可执行、归档文件等d目录b块设备、block、磁盘c字符设备、键盘、显示器p管道文件s网络socket文件l链接文件 link 然后后面的九…

2023年京东儿童智能手表行业数据分析(京东销售数据分析)

儿童消费市场向来火爆&#xff0c;儿童智能手表作为能够实现定位导航&#xff0c;信息通讯&#xff0c;SOS求救&#xff0c;远程监听&#xff0c;智能防丢等多功能的智能可穿戴设备&#xff0c;能够通过较为精准的定位功能和安全防护能力保障儿童的安全&#xff0c;因而广受消费…

Oracle字段长度不足位数补零

Oracle字段长度不足位数补零 有时候从数据库中取出的月份值是1&#xff0c;而不是01&#xff0c;该怎么办呢 SELECTLPAD( CODE_MONTH, 2, 0 ) FROMtb_cube_TY001 WHERECODE_BM_MEATYPE TY20 AND code_measure MYLX01 AND code_month <> ~ AND CODE_ENTITY 01A AND…

k8s 安装istio (一)

前置条件 已经完成 K8S安装过程十&#xff1a;Kubernetes CNI插件与CoreDNS服务部署 部署 istio 服务网格与 Ingress 服务用到了 helm 与 kubectl 这两个命令行工具&#xff0c;这个命令行工具依赖 ~/.kube/config 这个配置文件&#xff0c;目前只在 kubernetes master 节点中…

Centos 7 安装系列(8):openGauss 3.0.0

安装依赖包&#xff1a; yum -y install libaio-devel flex bison ncurses-devel glibc-devel patch redhat-lsb-core readline-devel openssl-devel sqlite-devel libnsl 安装插件&#xff1a; yum install -y bzip2 net-tools为什么要安装这两个&#xff1f; 安装bzip2 是…

Ansible 创建使用角色

使用 Ansible Galaxy 和要求文件 /ansible/roles/requirements.yml 。从以下 URL 下载角色并安装到 /ansible/roles &#xff1a; http://materials/haproxy.tar 此角色的名称应当为 balancer http://materials/phpinfo.tar 此角色的名称应当为 phpinfo #创建 vim /ansible/r…

Wlan——锐捷零漫游网络解决方案以及相关配置

目录 零漫游介绍 一代零漫游 二代单频率零漫游 二代双频率零漫游 锐捷零漫游方案总结 锐捷零漫游方案的配置 配置无线信号的信道 开启关闭5G零漫游 查看配置 零漫游介绍 普通的漫游和零漫游的区别 普通漫游 漫游是由一个AP到另一个AP或者一个射频卡到另一个射频卡的漫…

工程管理与工作流

1 统一开发环境/ 协作工具 你知道开发环境指的是什么吗&#xff1f; 开发环境&#xff1a; 工程运行环境、开发工具/ 编辑器 、开发依赖环境、 配置文件 软件环境&#xff1a; “仿真预演”环境 Staging 生产环境前最终验证、 这一环境尽可能的仿真了真实的生产环境 、另一个…

MinIO线上扩容实战

硬件投入肯定是随着业务的增长而增长&#xff0c;这就要求中间件平台必须提供水平伸缩机制&#xff0c;MinIO对象存储服务也不例外&#xff0c;本文就详细介绍MinIO的扩容。 Minio支持通过增加新的Server Pool来扩容老的集群。每个Server Pool都是一个相对独立的故障域&#x…

SpeedBI数据可视化工具:浏览器上做分析

SpeedBI数据分析云是一种在浏览器上进行数据可视化分析的工具&#xff0c;它能够将数据以可视化的形式呈现出来&#xff0c;并支持多种数据源和图表类型。 所有操作&#xff0c;均在浏览器上进行 在浏览器中打开SpeedBI数据分析云官网&#xff0c;点击【免费使用】进入&#…

SQL Monitor Crack,PostgreSQL监控的传入复制图表

SQL Monitor Crack,PostgreSQL监控的传入复制图表  现在&#xff0c;您可以在从Estate页面导出的Microsoft Excel报告的摘要标题中看到UTC偏移量。 添加了PostgreSQL监控的传入复制图表。 Microsoft PowerShell API现在支持将使用New-SqlMonitorWindowsHost和New-SqlMonitorin…

【脚踢数据结构】图(纯享版)

(꒪ꇴ꒪ )&#xff0c;Hello我是祐言QAQ我的博客主页&#xff1a;C/C语言&#xff0c;Linux基础&#xff0c;ARM开发板&#xff0c;软件配置等领域博主&#x1f30d;快上&#x1f698;&#xff0c;一起学习&#xff0c;让我们成为一个强大的攻城狮&#xff01;送给自己和读者的…

vellum (Discovering Houdini VellumⅡ柔体系统)学习笔记

视频地址&#xff1a; https://www.bilibili.com/video/BV1ve411u7nE?p3&spm_id_frompageDriver&vd_source044ee2998086c02fedb124921a28c963&#xff08;搬运&#xff09; 个人笔记如有错误欢迎指正&#xff1b;希望可以节省你的学习时间 ~享受艺术 干杯&#x1f37b…