正则表达式:简化模式匹配的利器

正则表达式:简化模式匹配的利器

  • 一、正则表达式简介
    • 1.1 正则表达式介绍
    • 1.2 正则表达式使用场景
  • 二、正则表达式语法
    • 2.1 正则表达式元字符和特性
    • 2.2 正则表达式常用匹配
  • 三、正则表达式实战
    • 3.1 常见的正则表达式用法
    • 3.2 正则表达式的过滤用法
    • 3.3 正则表达式的代码用法
  • 四、结论

在软件开发和文本处理中,经常需要进行模式匹配和文本搜索。这时,正则表达式是一种强大的工具,可以帮助我们高效地进行字符串匹配和处理。本文将介绍正则表达式的基本概念和用法,帮助读者掌握这个强大的工具。

一、正则表达式简介

1.1 正则表达式介绍

正则表达式(Regular Expression),通常缩写为RegexRegExp,是一种用来匹配字符串模式的文本模式,也可以称为模式字符串,它由一系列字符和特殊字符组成,用于文本处理、搜索、匹配和替换,正则表达式是一个强大的工具。

1.2 正则表达式使用场景

正则表达式常用于搜索文档日志文件和代码中的特定文本模式。例如,查找包含特定关键词或短语的行。在表单验证和数据输入处理中,可以使用正则表达式来验证用户输入的数据是否符合特定的格式,如电子邮件地址、电话号码、日期、密码等。在日志文件中,正则表达式可用于提取有关系统运行状况、错误或警告的信息,以便分析和报告。

正则表达式广泛应用于各种编程语言和工具中。以下是几个常见的应用场景:

  • 字符串匹配:使用正则表达式在文本中查找指定模式的字符串。
  • 字符串替换:使用正则表达式将字符串中的特定模式替换为指定内容。
  • 表单验证:使用正则表达式验证用户输入的表单数据,如手机号码、邮箱等。
  • 数据抽取:使用正则表达式从文本中提取特定模式的数据。

二、正则表达式语法

2.1 正则表达式元字符和特性

📍 字符匹配

  • 普通字符:普通字符按照字面意义进行匹配,例如匹配字母 “a” 将匹配到文本中的 “a” 字符。
  • 元字符:元字符具有特殊的含义,例如 \d 匹配任意数字字符,\w 匹配任意字母数字字符,. 匹配任意字符(除了换行符)等。

📍 量词

  • *:匹配前面的模式零次或多次。
  • +:匹配前面的模式一次或多次。
  • ?:匹配前面的模式零次或一次。
  • {n}:匹配前面的模式恰好 n 次。
  • {n,}:匹配前面的模式至少 n 次。
  • {n,m}:匹配前面的模式至少 n 次且不超过 m 次。

*+ 限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个 ? 就可以实现非贪婪或最小匹配。

📍 字符类

  • [ ]:匹配括号内的任意一个字符。例如,[abc] 匹配字符 “a”、“b” 或 “c”。
  • [^ ]:匹配除了括号内的字符以外的任意一个字符。例如,[^abc] 匹配除了字符 “a”、“b” 或 “c” 以外的任意字符。

📍 边界匹配

  • ^:匹配字符串的开头。
  • $:匹配字符串的结尾。
  • \b:匹配单词边界。
  • \B:匹配非单词边界。

📍 分组和捕获

  • ( ):用于分组和捕获子表达式。
  • (?: ):用于分组但不捕获子表达式。

📍 特殊字符

  • \:转义字符,用于匹配特殊字符本身。
  • .:匹配任意字符(除了换行符)。
  • |:用于指定多个模式的选择。

📍 非捕获元

  • ?::为正向预查,在任何开始匹配圆括号内的正则表达式模式的位置来匹配搜索字符串

  • ?= ?!:为负向预查,在任何开始不匹配该正则表达式模式的位置来匹配搜索字符串

在这里插入图片描述

2.2 正则表达式常用匹配

  • [ABC]:匹配 […] 中的所有字符
  • [^ABC]:匹配除了 […] 中字符的所有字符
  • [A-Z]: [A-Z] 表示一个区间,匹配所有大写字母,[a-z] 表示所有小写字母
  • .:匹配除换行符(\n、\r)之外的任何单个字符,相等于[^\n\r]
  • [\s\S]:匹配所有。\s 是匹配所有空白符,包括换行,\S 非空白符,不包括换行
  • \w:匹配字母、数字、下划线。等价于 [A-Za-z0-9_]
  • \d:匹配任意一个阿拉伯数字(0 到 9)。等价于 [0-9]
  • \n:匹配一个换行符
  • \r:匹配一个回车符
  • \s:匹配任何空白字符,包括空格、制表符、换页符等
  • \S:匹配任何非空白字符
  • \t:匹配一个制表符
  • ?=:exp1(?=exp2):查找 exp2 前面的 exp1
  • ?<=:(?<=exp2)exp1:查找 exp2 后面的 exp1
  • ?!:exp1(?!exp2):查找后面不是 exp2 的 exp1
  • ?<!:(?<!exp2)exp1:查找前面不是 exp2 的 exp1

三、正则表达式实战

3.1 常见的正则表达式用法

在这里插入图片描述

  1. 邮箱验证:^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
  2. 手机号码验证:^1[3456789]\d{9}$
  3. URL 提取:^(https?|ftp)://[^\s/$.?#].[^\s]*$
  4. 数字提取:\d+
  5. IP 地址验证:^((25[0-5]|2[0-4]\d|[01]?\d\d?)\.){3}(25[0-5]|2[0-4]\d|[01]?\d\d?)$

3.2 正则表达式的过滤用法

🚀 过滤用法之或

在使用grep命令进行正则表达式匹配时,可以使用-E选项来启用扩展正则表达式。然后,你可以使用以下正则表达式来匹配包含"string1"或"string2"的文本:

grep -E "string1|string2" <file>

在上面的命令中,你需要将<file>替换为你要搜索的文件名或路径。string1string2是你要匹配的两个字符串。

-E选项告诉grep使用扩展正则表达式,其中的|表示逻辑或操作符。

请确保使用实际的文件名和字符串来替换命令中的占位符。另外,grep命令默认区分大小写。如果你想进行大小写不敏感的匹配,可以添加-i选项,如grep -Ei "string1|string2" <file>。这将在忽略大小写的情况下匹配字符串。

🚀 过滤用法之与

要使用grep命令匹配同时包含"string1"和"string2"的文本行,你可以使用正则表达式的正向肯定前瞻(positive lookahead)来实现。

以下是一个示例正则表达式,用于匹配同时包含"string1"和"string2"的文本行:

grep -E "^(?=.*string1)(?=.*string2)" <file>

在上面的命令中,你需要将<file>替换为你要搜索的文件名或路径。string1string2是你要匹配的两个字符串。

正则表达式使用正向肯定前瞻,分别包含两个部分:

  • (?=.*string1):表示在当前位置向前查找,必须包含"string1"。
  • (?=.*string2):表示在当前位置向前查找,必须包含"string2"。

使用^匹配行的开头,确保这两个条件都适用于整行。

请确保使用实际的文件名和字符串来替换命令中的占位符。另外,grep命令默认区分大小写。如果你想进行大小写不敏感的匹配,可以添加-i选项,如grep -Ei "^(?=.*string1)(?=.*string2)" <file>。这将在忽略大小写的情况下匹配字符串。

3.3 正则表达式的代码用法

  • Java 正则代码
import java.util.regex.Matcher;
import java.util.regex.Pattern;public class RegexMatches {public static void main(String args[]) {String str = "";String pattern = "";Pattern r = Pattern.compile(pattern);Matcher m = r.matcher(str);System.out.println(m.matches());}}
  • Python 正则代码
import re
pattern = re.compile(ur'')
str = u''
print(pattern.search(str))

四、结论

正则表达式是一种强大而灵活的工具,可以帮助我们在文本处理和模式匹配中提高效率。本文介绍了正则表达式的基本概念和常见用法,希望读者能够掌握这个重要的工具,并在实际开发中灵活应用。通过深入学习和实践,你将能够更加熟练地使用正则表达式解决各种文本处理的挑战。

相关参考
[1] OSChina 正则表达式手册
[2] 菜鸟教程 - 正则表达式 - 语法
[3] 正则表达式在线测试

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/218193.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Fiddler中AutoResponder的简单使用

AutoResponder&#xff0c;自动回复器&#xff0c;用于将 HTTP 请求重定向为指定的返回类型。 这个功能有点像是一个代理转发器&#xff0c;可以将某一请求的响应结果替换成指定的资源&#xff0c;可以是某个页面也可以是某个本地文件 1.使用 打开“Fiddler”&#xff0c;点击…

11.jvm第三方工具使用实践

目录 概述GCEasy官网jvm内存占用情况关键性能指标堆内存与元空间优化 MAT安装MAT相关概念说明内存泄漏与内存溢出shallow heap及retained heapoutgoing references与incoming referencesDominator Tree GCViewerArthas下载安装与启动jdk8jdk 11jdk11自定义boot jarjdk17 常用命…

聊聊Java中的常用类String

String、StringBuffer、StringBuilder 的区别 从可变性分析 String不可变。StringBuffer、StringBuilder都继承自AbstractStringBuilder &#xff0c;两者的底层的数组value并没有使用private和final修饰&#xff0c;所以是可变的。 AbstractStringBuilder 源码如下所示 ab…

fckeditor编辑器在Chrome浏览器下编辑时多出空格解决方法

查看专栏目录 Network 灰鸽宝典专栏主要关注服务器的配置&#xff0c;前后端开发环境的配置&#xff0c;编辑器的配置&#xff0c;网络服务的配置&#xff0c;网络命令的应用与配置&#xff0c;windows常见问题的解决等。 文章目录 结尾语网络的梦想 dedecms网站后台采用fckedi…

「构」向云端 - 我与 2023 亚马逊云科技 re:Invent 大会

授权声明&#xff1a;本篇文章授权活动官方亚马逊云科技文章转发、改写权&#xff0c;包括不限于在 亚马逊云科技开发者社区, 知乎&#xff0c;自媒体平台&#xff0c;第三方开发者媒体等亚马逊云科技官方渠道 2023年亚马逊AWS re:Invent大会宣布一项Amazon Q的创新项目&#x…

nodejs+vue+微信小程序+python+PHP全国天气可视化分析系统-计算机毕业设计推荐

3.2.1前台用户功能 前台用户可分为未注册用户需求和以注册用户需求。 未注册用户的功能如下&#xff1a; 注册账号&#xff1a;用户填写个人信息&#xff0c;并验证手机号码。 浏览天气资讯&#xff1a;用户可以浏览天气资讯信息详情。 已注册用户的功能如下&#xff1a; 登录&…

Ajax详解

目录 服务器与Ajax 1.初识Ajax Asynchronous JavaScript and XML&#xff08;异步的 JavaScript 和 XML&#xff09;。 2.Ajax可以做什么&#xff1f; 3.Ajax基础知识铺垫 4.前端相关的技术点&#xff1a; 5.客户端与服务器 6.客户端 浏览器、app、应用软件 7.服务器…

图论——二分图

图论——二分图 二分图通俗解释 有一个图&#xff0c;将顶点分成两类&#xff0c;边只存在不同类顶点之间&#xff0c;同类顶点之间设有边。称图 G 为二部图&#xff0c;或称二分图&#xff0c;也称欧图。 性质 二分图不含有奇数环图中没有奇数环&#xff0c;一定可以转换为二…

SpringBoot中日志的使用log4j2

SpringBoot中日志的使用log4j2 1、log4j2介绍 Apache Log4j2 是对 Log4j 的升级&#xff0c;它比其前身 Log4j 1.x 提供了重大改进&#xff0c;并提供了 Logback 中可用的许多改 进&#xff0c;同时修复了 Logback 架构中的一些问题&#xff0c;主要有&#xff1a; 异常处理…

Docker Swarm编排:构建简单集群

Docker Swarm 是 Docker 官方提供的容器编排工具&#xff0c;通过它可以轻松构建和管理多个 Docker 容器的集群。本文将深入探讨 Docker Swarm 的基础概念、构建集群的步骤&#xff0c;并提供更为丰富和实际的示例代码&#xff0c;帮助大家全面了解如何使用 Docker Swarm 搭建一…

解决Chrome同一账号在不同设备无法自动同步书签的问题

文章目录 一、问题与原因&#xff1f;2. 解决办法 一、问题与原因&#xff1f; 1.问题 使用谷歌Chrome浏览器比较头疼的问题就是&#xff1a;使用同一个Google账号&#xff0c;办公电脑与家用电脑的数据无法同步。比如&#xff1a;办公电脑中的书签、浏览记录等数据&#xff0…

【深度学习目标检测】六、基于深度学习的路标识别(python,目标检测,yolov8)

YOLOv8是一种物体检测算法&#xff0c;是YOLO系列算法的最新版本。 YOLO&#xff08;You Only Look Once&#xff09;是一种实时物体检测算法&#xff0c;其优势在于快速且准确的检测结果。YOLOv8在之前的版本基础上进行了一系列改进和优化&#xff0c;提高了检测速度和准确性。…

网络互通--三层交换机配置

目录 一、三层交换机的原理 1、概念 2、PC A与不同网段的PC B第一次数据转发过程 3、一次路由&#xff0c;多次转发的概念 4、 三层交换机和路由器的比较 二、利用实验理解交换机 1、建立以下拓扑图​编辑 2、分别配置主机的IP地址&#xff0c;子网掩码、网关等信息 3、…

[每周一更]-(第27期):HTTP压测工具之wrk

[补充完善往期内容] wrk是一款简单的HTTP压测工具,托管在Github上,https://github.com/wg/wrkwrk 的一个很好的特性就是能用很少的线程压出很大的并发量. 原因是它使用了一些操作系统特定的高性能 io 机制, 比如 select, epoll, kqueue 等. 其实它是复用了 redis 的 ae 异步事…

Axure的安装及界面基本功能介绍

目录 一. Axure概述 二. Axure安装 2.1 安装包下载 2.2 安装步骤 三. Axure功能介绍​ 3.1 工具栏介绍 3.1.1 复制&#xff0c;剪切及粘贴 3.1.2 选择模式和连接 3.1.3 插入形状 3.1.4 点&#xff08;编辑控点&#xff09; 3.1.5 置顶和置底 3.1.6 组合和取消组合 …

(1)(1.8) MSP(MultiWii 串行协议)(4.1 版)

文章目录 前言 1 协议概述 2 配置 3 参数说明 前言 ArduPilot 支持 MSP 协议&#xff0c;可通过任何串行端口进行遥测和传感器。这允许 ArduPilot 将其遥测数据发送到 MSP 兼容设备&#xff08;如大疆护目镜&#xff09;&#xff0c;用于屏幕显示&#xff08;OSD&#xff…

2021年数维杯国际大学生数学建模A题新冠肺炎背景下港口资源优化配置策略求解全过程文档及程序

2021年数维杯国际大学生数学建模 A题 新冠肺炎背景下港口资源优化配置策略 原题再现&#xff1a; 2020年初&#xff0c;新型冠状病毒&#xff08;COVID-19&#xff09;在全球迅速蔓延。根据世界卫生组织2021年7月31日的报告&#xff0c;新冠病毒疫情对人类的影响可能比原先预…

Kubernetes 的用法和解析 -- 2

一.集群常用指令 1.1 基础控制指令 # 查看对应资源: 状态 $ kubectl get <SOURCE_NAME> -n <NAMESPACE> -o wide [rootkube-master ~]# kubectl get pods -n kuboard -o wide# 查看对应资源: 事件信息 $ kubectl describe <SOURCE_NAME> <SOURCE_NAME_R…

系统运行占用过高

1、CPU过高的问题排查 示例代码&#xff1a; public class Test { static class MyThread extends Thread { public void run() { // 死循环&#xff0c;消耗CPU int i 0; while (true) { i; } } } public static void main(String args[]) throws InterruptedException { ne…

Unity实现GoF23种设计模式

文章目录 Unity实现GoF23种设计模式概要一、创建型模式(Creational Patterns):二、结构型模式(Structural Patterns):三、行为型模式(Behavioral Patterns):Unity实现GoF23种设计模式概要 GoF所提出的23种设计模式主要基于以下面向对象设计原则: 对接口编程而不是对实…