正则表达式不会用?一篇教你快速搞懂 !

目录

    • 前言
    • 一、基础字符
    • 二、一系列常用的字符;
      • 1、一些元字符(Meta-characters)
    • 三、一些高级概念
      • 1、贪婪与懒惰匹配
      • 2、两个实例加深理解
        • 1.颜色值的匹配:RGBS值
        • 2.ipv4 地址匹配
    • 四、正则表达式常用语法
      • **1.Flags(标志符或修饰符)**
      • 2. **Character Sets(字符集合)**
      • 3. **Quantifiers (量词)**
      • 4. **Metacharacters(元字符)**
      • 5.贪婪/懒惰匹配(Greedy/Lazy Match)
    • Python经验分享
        • 一、Python所有方向的学习路线
        • 二、学习软件
        • 三、入门学习视频
        • 四、实战案例
        • 五、面试资料

前言

正则表达式对于我们来说既熟悉又陌生,我们在很多时候都遇到过,但是学起来又很难记,不好理解;在没有接触正则表达式的时候,我就在想这一串奇怪的字符为啥可以代替其他很长的一段代码就可以得到预期值,去网上找资料和技术文章学习的时候,发现有很多知识点晦涩难懂;下面我将用非常通俗易懂的方法和大家一起学习正则表达式。

正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。

首先我们要在网页编译器 regular expression 101 在线编译里自己动手跟着操作一遍就会发现其实没有那么难理解。(一定要实际动手操作加深记忆)

对Python感兴趣的话,文末领取全套最新Python学习资源,祝你一臂之力!

一、基础字符

接下来一起操作一遍:(默认选中颜色表示符合条件)

1. +号表示前边的字符必须至少出现一次(1次或多次);

1.png

  1. * 表示前边的字符可以不出现,或者出现一次或者多次(0次、或1次、或多次)

2.png

3.?号表示前面的字符最多只可以出现一次(0次或1次)

3.png

  1. {}号:

还是上边的例子

比如希望{}前面的字符出现的次数是4次,就用{4}表示

4.png

{} 还可以允许我们输入一个范围;比如{2,4}表示前一个字符出现2到4次;

5.png

如果想表示出现2次以上;就用{2,}表示;

6.png

  1. 如果想查找多个字符就()+

7.png

6.“或” 通配符 如果想找 a dog和a cat就在()里加“|”;这里前面会先区匹配“a”

8.png

7.字符类[]+可以匹配中括号里的字符,匹配到的字符只能取自于它们

9.png

另外 []+ 可以匹配字符的范围

[a-z]+ 表示匹配所有的小写英文字母;[A-Z]+ 表示匹配所有的大写英文字母;

[a-zA-Z]+ 表示匹配所有的英文字符;[a-zA-Z0-9]+ 表示所有的英文字符和数字

8.如果在 []+ 前边加 ^ ,就表示匹配除了尖号后边列出的【以外】的字符(包括换行符)

10.png

二、一系列常用的字符;

1、一些元字符(Meta-characters)

比如数字、空白符、单词开头、结尾等等它们被称为元字符;

\d \w \s \D \W \S … 正则表达式的大多数元字符都以反斜杠开头;

1)\d 是数字字符,等同于之前写的 [0-9]+;

11.png

2)\w 代表单词字符(英文、数字及下划线)

12.png

3)\s 代表空白符 (包含Tab和换行符)

13.png

4)与 \d 相对应的 \D 代表非数字字符

14.png

5) 与 \w 相对应的 \W 代表非单词字符

15.png

6) 与 \s 相对应的 \S 代表非空白字符

16.png

2. 其中 . 在正则表达式中也是一个特殊字符;它代表任意字符,但不包含换行字符。

17.png

3.两个特殊字符 ^ 匹配行首、$ 匹配行尾;

18.png

19.png

三、一些高级概念

1、贪婪与懒惰匹配

之前学到 * + {} 在匹配字符串的时候默认会去匹配尽可能多的字符

比如我们需要匹配下边的html标签;我们 最开始想到的肯定是 <.+>来匹配;

20.png

但是这么会把全部字符和标签选中,因为 . 表示任意字符,+ 号又表示前一项可以出现多次;不是我们想要的标签匹配,那么我们该怎么办呢?其实只需要在+号右边加一个 就好了。

它会将正则表达式中默认的贪婪匹配(Greedy Math)切换为懒惰匹配(Lazy Match)

我们来试一下:

21.png

2、两个实例加深理解

1.颜色值的匹配:RGBS值

因为RGM码是由#6位十六进制字符组成;

首先要匹配,颜色匹配符前边的#号;因为RGM是十六进制的,所以只能取自a-fA-F0-9之间; 并且长度一定是6位,最后\b作为边界值,避免不是RGM颜色的代码被识别。 一起在编译器里看一下:

22.png

可以得到预期匹配值。

2.ipv4 地址匹配

其实Ipv4地址是由四段代码实现的,数字之间由句号隔开;如果要在文本中提取所有出现的ip地址

可以直接使用\d+\.d+\.d+\.d+来进行匹配;

思路1)首先\d+ 会匹配所有的数字;

23.png

这里可以看到成功的匹配到了ipv4地址;

但是还存在一个问题;ip地址都是八位的,也就是它的范围介于0-255之间

但是256很明显超出了范围,但是还是被匹配了。

2)这时候就需要换一种思路:

首先匹配25,然后第二位取[0-5]之间的数字 : 25[0-5];

其次如果它的第一个字母是2,第二个字母是[0-4]之间的,最后一位可以取0-9之间的任意值用 \d表示 : 2[0-4]\d;

如果第一位是[01],那么最后两位可以取00-99之间的任意数字这里用\d\d表示:[01]\d\d

这三种情况中间用 | 号连接;

但是有时候,IP地址每一段也可以是两位数字甚至一位数字,这时候就可以直接在后两位数字后边加 来表示。这时候数字部分就匹配完成:25[0-5]|2[0-4]\d|[01]?\d\d?

我们需要匹配三次 ((25[0-5]|2[0-4]\d|[01]?\d\d?)\.){3};把前三段数字和后边的句点匹配完毕;

然后后边的代码还需要重复前边三段的代码 ;最后需要在收尾都加入 \ b 来匹配字符的边界;

然后看一下完整代码:

\b((25[0-5]|2[0-4]\d|[01]?\d\d?)\.){3}(25[0-5]|2[0-4]\d|[01]?\d\d?)\b

25.png

这里看出我们已经可以匹配到预期的完整字符。

四、正则表达式常用语法

1.Flags(标志符或修饰符)

g:全局匹配(global);正则表达式默认只会返回第一个匹配结果,使用标志符g则可以返回所有匹配

i:忽略大小写(case-insensitive);在匹配时忽略英文字母的大小写

m:多行匹配(multiline);将开始和结束字符(^和$)视为在多行上工作,即分别匹配每一行(由 \n 或 \r 分割)的开始和结束,而不只是只匹配整个输入字符串的最开始和最末尾处

2. Character Sets(字符集合)

用于匹配字符集合中的任意一个字符,常见的字符集有:

[xyz]:匹配 “x"或"y”``“z”

[^xyz]:补集,匹配除 “x” “y” "z"的其他字符

[a-z]:匹配从 “a” 到 “z” 的任意字符

[^a-n]:补集,匹配除 “a” 到 “n” 的其他字符

[A-Z]:匹配从 “A” 到 “Z” 的任意字符

[0-9]:匹配从 “0” 到 “9” 的任意数字

比如匹配所有的字母和数字可以写成:/[a-zA-Z0-9]/ 或者 /[a-z0-9]/i

3. Quantifiers (量词)

在实际使用中常需要匹配同一类型的字符多次,比如匹配 11 位的手机号,我们不可能将 [0-9] 写 11 遍,此时可以使用 Quantifiers 来实现重复匹配。

{n}:匹配 n 次

{n,m}:匹配 n-m 次

{n,}:匹配 >=n 次

?:匹配 0 || 1 次

*:匹配 >=0 次,等价于 {0,}

+:匹配 >=1 次,等价于 {1,}

4. Metacharacters(元字符)

常见的元字符有:

\d:匹配任意数字,等价于 [0-9]

\D:匹配任意非数字字符;\d 的补集

\w:匹配任意基本拉丁字母表中的字母和数字,以及下划线;等价于 [A-Za-z0-9_]

\W:匹配任意非基本拉丁字母表中的字母和数字,以及下划线;\w 的补集

\s:匹配一个空白符,包括空格、制表符、换页符、换行符和其他 Unicode 空格

\S:匹配一个非空白符;\s的补集

\b:匹配一个零宽单词边界,如一个字母与一个空格之间;例如,/\bno/ 匹配 “at noon” 中的 “no”,/ly\b/ 匹配 “possibly yesterday.” 中的 “ly”

\B:匹配一个零宽非单词边界,如两个字母之间或两个空格之间;例如,/\Bon/ 匹配 “at noon” 中的 “on”,/ye\B/ 匹配 "possibly yesterday."中的 “ye”

\t:匹配一个水平制表符(tab)

\n:匹配一个换行符(newline)

\r:匹配一个回车符(carriage return)

5.贪婪/懒惰匹配(Greedy/Lazy Match)

<.+>: 默认贪婪匹配“任意字符”; <.+?>: 懒惰匹配“任意字符”;


以上就是今天的全部内容分享,觉得有用的话欢迎点赞收藏哦!

Python经验分享

学好 Python 不论是用于就业还是做副业赚钱都不错,而且学好Python还能契合未来发展趋势——人工智能、机器学习、深度学习等。但要学会 Python 还是要有一个学习规划,这样才能学的更快更稳,最后给大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!
包括:Python激活码+安装包、Python web开发,Python爬虫,Python数据分析,人工智能、机器学习、Python量化交易等学习教程。

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

二、学习软件

工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。

三、入门学习视频

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。

四、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

五、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。


最新全套【Python入门到进阶资料 & 实战源码 &安装工具】(安全链接,放心点击)

我已经上传至CSDN官方,如果需要可以扫描下方官方二维码免费获取【保证100%免费】

*今天的分享就到这里,喜欢且对你有所帮助的话,记得点赞关注哦~下回见 !

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/287962.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c语言中动态内存管理

说到内存&#xff0c;大家一定都知道。但是有一种函数可以实现动态内存管理&#xff0c;下面大家一起学习。 文章目录 一、为什么要有动态内存管理&#xff1f;二、malloc 和 free1.malloc2.free 三、calloc 和 realloc1.calloc2.realloc3.常见的动态内存的错误3.1对NULL指针的…

面试题 之 webpack

1.说说你对webpack理解&#xff1f;解决什么问题&#xff1f; Webpack 是实现前端项目的模块化&#xff0c;用于现代 JavaScript 应用程序的静态模块打包工具&#xff0c;被webpack 直接引用的资源打包进 bunde.js的资源&#xff0c;当webpack 处理应用程序时,它会在内部构建一…

理解CPU与执行指令原理

本文侧重介绍cpu的工作任务&#xff0c;与cpu执行指令的过程是怎么样的&#xff1f; 目录 1.理解CPU 1.1.CPU的功能 1.2.CPU的逻辑构成 2.认识指令 2.1.什么是指令 2.2.CPU执行指令的准备工作(重点) 3.指令的执行过程 前景知识&#xff1a; 什么是计算机 就是遵循冯诺依…

阿里云部署宝塔,设置了安全组还是打不开。

1.在安全组是开放正确的端口好。8888要开&#xff0c;但是不只是开放8888&#xff0c;举个例子&#xff0c;https://47.99.53.222:17677/49706cf7这个&#xff0c;要开放17677这个端口号。 2.安全组要挂载到实例上&#xff0c;从三个点的进入点击管理实例&#xff0c;加到对应的…

深入聊聊企业数字化转型这个事儿

01 什么是数字化&#xff1f; 聊数字化&#xff0c;就不得不聊聊信息化、智能化。佛性的说&#xff1a;信息化是数字化的前世&#xff0c;智能化是数字化的来生&#xff01;我习惯用一个结构化的图形来表示事物之间的关系&#xff0c;信息化、数字化、智能化的关系如下&#…

[flask] flask的基本介绍、flask快速搭建项目并运行

笔记 Flask Flask 本身相当于一个内核&#xff0c;其他几乎所有的功能都要用到扩展&#xff08;邮件扩展Flask-Mail&#xff0c;用户认证Flask-Login&#xff0c;数据库Flask-SQLAlchemy&#xff09;&#xff0c;都需要用第三方的扩展来实现。比如可以用 Flask 扩展加入ORM、…

JVM本地方法

本地方法接口 NAtive Method就是一个java调用非java代码的接口 本地方法栈&#xff08;Native Method Statck&#xff09; Java虚拟机栈用于管理Java方法的调用&#xff0c;而本地方法栈用于管理本地方法的调用。 本地方法栈&#xff0c;也是线程私有的。 允许被实现成固定或…

想做抖音小店又不会该怎么办?先学会做店出单逻辑,再入门

大家好&#xff0c;我是电商花花。 现在在这个巨大的电商市场中&#xff0c;很多人都被电商的巨大红利给勾起来了&#xff0c;在这个抖音小店的黑马项目中&#xff0c;很多人都在其中赚钱获利&#xff0c;吸引了一批又一批商家。 相信现在对电商感兴趣的仍不在少数&#xff0…

Navicat BI 工具 | 连接数据

早前&#xff0c;海外 LearnBI online 博主 Adam Finer 对 Navicat Charts Creator 这款 BI&#xff08;商业智能&#xff09;工具进行了真实的测评。上一期&#xff0c;我们介绍了这位博主对 Navicat BI 工具的初始之感。今天&#xff0c;我们来看看从连接数据的角度&#xff…

Tomcat 下载以及安装

Tomcat安装及配置教程主要分为四步&#xff1a; 步骤一&#xff1a;首先确认自己是否已经安装JDK 1. cmd&#xff1a;查看java的版本 步骤二&#xff1a;下载安装Tomcat 1. 下载tomcat :Apache Tomcat - Welcome! 2. 选择对应的tomcat版本&#xff1a; 3. 进行安装&#…

C# 登录界面代码

背景 MVVM 是一种软件架构模式&#xff0c;用于创建用户界面。它将用户界面&#xff08;View&#xff09;、业务逻辑&#xff08;ViewModel&#xff09;和数据模型&#xff08;Model&#xff09;分离开来&#xff0c;以提高代码的可维护性和可测试性。 MainWindow 类是 View&a…

38 mars3d 对接地图图层 绘制点线面员

前言 这里主要是展示一下 mars3d 的一个基础的使用 主要是设计 接入地图服务器的 卫星地图, 普通的二维地图, 增加地区标记 基础绘制 点线面园 等等 测试用例 <template><div style"width: 1920px; height:1080px;"><div class"mars3dClas…

【论文笔记】RobotGPT: Robot Manipulation Learning From ChatGPT

【论文笔记】RobotGPT: Robot Manipulation Learning From ChatGPT 文章目录 【论文笔记】RobotGPT: Robot Manipulation Learning From ChatGPTAbstractI. INTRODUCTIONII. RELATED WORK1. LLMs for Robotics2. Robot Learning III. METHODOLOGY1. ChatGPT Prompts for Robot …

【leetcode】双“指针”

标题&#xff1a;【leetcode】双指针 水墨不写bug 我认为 讲清楚为什么要用双指针 比讲怎么用双指针更重要&#xff01; &#xff08;一&#xff09;快乐数 编写一个算法来判断一个数 n 是不是快乐数。 「快乐数」 定义为&#xff1a; 对于一个正整数&#xff0c;每一次将该数…

我们常用Linux命令总结

Linux作为一种自由和开放源代码的操作系统&#xff0c;广泛应用于各种计算机系统中&#xff0c;尤其是服务器环境。在Linux系统中&#xff0c;命令行是管理和操作系统的主要方式之一&#xff0c;熟练掌握常用的Linux命令对于系统管理员、开发人员和其他使用者来说都是至关重要的…

HDLBits刷题Day28,3.2.5.14 3.2.5.14 one-hot FSM

3.2.5.14 one-hot FSM 问题描述 给定以下具有 1 个输入和 2 个输出的状态机&#xff1a; 假设此状态机使用 one-hot 编码&#xff0c;其中state[0]到state[9]分别对应于状态 S0 到 S9。除非另有说明&#xff0c;否则输出为零。 仅实现状态机的状态转换逻辑和输出逻辑部分。您在…

Jsonpath - 数据中快速查找和提取的强大工具

JSON&#xff08;JavaScript Object Notation&#xff09;在现代应用程序中广泛使用&#xff0c;但是如何在复杂的JSON数据中 查找和提取所需的信息呢&#xff1f; JSONPath是一种功能强大的查询语言&#xff0c;可以通过简单的表达式来快速准确地定位和提取JSON数据。本文将介…

Spring boot2.X 配置https

背景 最近项目组说要将 http 升级成 https 访问&#xff0c;证书也给到我们这边了&#xff0c;当然我们这边用的是个二级域名&#xff0c;采用的是通配符访问的方式&#xff0c;比如一级域名是这样&#xff08;com.chinaunicom.cn&#xff09;&#xff0c;我们的则是&#xff0…

css预处理器scss的使用如何全局引入

目录 scss 基本功能 1、嵌套 2、变量 $ 3、mixin 和 include 4、extend 5、import scss 在项目中的使用 1、存放 scss 文件 2、引入 variables 和 mixins 2-1、局部引入 2-2、全局引入 3、入口文件中引入其他文件 项目中使用 css 预处理器&#xff0c;可以提高 cs…

【面试】Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法?

Elasticsearch 在部署时&#xff0c;对 Linux 的设置有哪些优化方法&#xff1f; Elasticsearch是一个分布式搜索和分析引擎&#xff0c;它在Linux环境下的性能和稳定性可以通过一些优化方法进行提升。以下是一些针对Linux环境下Elasticsearch部署的优化方法&#xff1a; 1. 内…