Shell编程之正则表达式（非常详细）

正则表达式

1.通配符和正则表达式的区别
2.基本正则表达式
- 2.1 元字符（字符匹配)
- 2.2 表示匹配次数
- 2.4 位置锚定
- 2.5 分组和或者
3.扩展正则表达式
4.部分文本处理工具
- 4.1 tr 命令
- 4.2 cut命令
- 4.3 sort命令
- 4.4 uniq命令

1.通配符和正则表达式的区别

通配符一般用于文件名匹配。
正则表达式一般用于匹配文件内容。

2.基本正则表达式

2.1 元字符（字符匹配)

匹配符1	功能
.	匹配任意单个字符，可以是一个汉字
[ … ]	匹配指定范围内的任意单个字符
[ ^… ]	匹配指定范围外的任意单个字符
^ [ … ]	匹配以…开头的

#补充说明#
.     #表示匹配任意字符[.  ] #方括号中的. 就是本身的含义 /.  #和[. ]相同

匹配符2	功能
[:alnum:]	字母和数字
[:alpha:]	代表任何英文大小写字符，亦即 A-Z, a-z
[:upper:]	大写字母，相当于[A-Z]
[:lower:]	小写字母,相当于[a-z]
[:blank:]	空白字符（空格和制表符）
[:space:]	包括空格、制表符(水平和垂直)、换行符、回车符等各种类型的空白
[:cntrl:]	不可打印的控制字符（退格、删除、警铃…）
[:digit:]	十进制数字
[:xdigit:]	十六进制数字
[:print:]	可打印字符
[:graph:]	可打印的非空白字符
[:punct:]	标点符号

#补充说明#
[:space:] 比[:blank:]包含的范围广

匹配符3	功能
\w	匹配单词构成部分
\W	匹配非单词构成部分
\s	匹配任何非空白字符
\S	匹配任何空白字符，包括空格、制表符、换页符等等

#补充说明#
\w 等价于[_[:alnum:]]
\W 等价于[^_[:alnum:]]
\S 等价于 [^ \f\n\r\t\v]
\s 等价于 [ \f\n\r\t\v]

2.2 表示匹配次数

匹配符	功能
*	匹配前面的字符任意次，包括0次
.*	任意长度的任意字符,不包括0次
?	匹配其前面的字符出现0次或1次
+	匹配其前面的字符出现最少1次
{n}	匹配前面的字符n次
{m,n}	匹配前面的字符至少m次，至多n次
{,n}	匹配前面的字符至多n次,<=n
{n,}	匹配前面的字符至少n次

示例：怎么提取IP地址？

ifconfig ens33|grep netmask \
|grep -o '[0-9]\+\.[0-9]\+\.[0-9]\+\.[0-9]\+'|head -n1# \+ 表示匹配前面的字符最少一次
# \. 表示转译 因为.表示匹配任意字符

在这里插入图片描述

2.4 位置锚定

匹配符	功能
^	行首锚定
$	行尾锚定
^$	空行
^ [[:space:]]*$	空白行
\ < 或 \b	词首锚定
\ > 或 \b	词尾锚定
\bPATTERN\b	匹配整个单词

示例1：统计/etc/fstab 文件中有多少真实单词？

cat /etc/fstab | grep -o '\b[a-zA-Z]\+\b'|wc -l
#不要有空格

在这里插入图片描述

示例2: 统计/etc/fstab文件中不是已#号开头的非空行的行数

cat /etc/fstab | grep "^[^#[:space:]]"  | wc -l
# ^ 以...开头 
#[非# 和 非空行]#或者
grep -vE "^\s*#|^$"

在这里插入图片描述

2.5 分组和或者

#分组#
( x y) 
将多个字符捆绑在一起，当作一个整体处理，如：\(root\)+

#或者#x \| y x或者y

示例:组合运用

echo 1abc 2abc 3abc |grep -o "1\|2abc"
#只匹配了1或者2abc
1  
2abc
echo 1abc 2abc 3abc |grep -o "\(1\|2\)abc"
#1abc或者2abc
1abc
2abc

在这里插入图片描述

3.扩展正则表达式

#基本格式#
grep -E-E表示使用扩展正则表达式

匹配符	功能
*	匹配前面子表达式0次或者多次
.*	任意长度的任意字符
？	匹配前面子表达式0次或者1次，即：可有可无
+	与星号相似，表示其前面字符出现一次或多次，但必须出现一次,>=1
{n,m}	匹配前面的子表达式n到m次
{m}	匹配前面的子表达式m次
{n,}	匹配前面的子表达式不少于n次, >=n
{，n}	匹配前面的子表达式最多n次，<=n
I	用逻辑或方式指定正则表达式要是用的模式
（）	字符串分组，将括号中的字符串作为一个整体

示例1：提取当前主机的IP地址

ifconfig ens33 | grep netmask| grep -Eo '([0-9]{1,3}\.){3}[0-9]{1,3}'|head -n 1
#-E表示使用扩展正则表达式 192.168.2.100 #执行结果

在这里插入图片描述

4.部分文本处理工具

4.1 tr 命令

tr命令用于字符转换或字符删除。

#基本格式#
tr [选项] 字符集1 字符集2
#字符集1 是要被替换或删除的字符集
#字符集2 是要替换为的字符集

#常用选项#-c 除了指定的字符之外的所有字符都会被替换
-d 表示删除指定的字符
-s 表示压缩重复的字符为单个字符

示例1：将文本中的大写字母转换为小写字母

echo "Hello World" | tr '[:upper:]' '[:lower:]'
hello world

在这里插入图片描述

示例2：删除文本中的数字

echo "123abc456" | tr -d '[:digit:]'
abc

在这里插入图片描述

示例3：将文本中的空格合并为单个空格

echo "Hello    World" | tr -s ' '
Hello World

在这里插入图片描述

示例4：删除文本中的特殊字符

echo "Hello @#World" | tr -d '@#'
Hello World

在这里插入图片描述

4.2 cut命令

cut命令可以提取文本数据中指定的列。
cut命令可以根据指定的字符位置或指定的字段分隔符来截取文本，并将结果输出到标准输出或指定的文件。

#基本格式#
cut [选项] 文件

-d 指定字段的分隔符，默认为制表符。
-f 指定要提取的字段列表，字段列表之间使用逗号分隔，例如`-f 1,3,5`
-c 指定要提取的字符位置列表，字符位置列表之间使用逗号分隔，例如`-c 1-5,10-15`
--complement 提取指定字段或字符位置之外的内容

#提取文件的第一列cut -f1 file.txt#提取文件的第二、四、五列，并使用逗号作为分隔符cut -f2,4,5 -d',' file.txt#提取文件的前五个字符：cut -c1-5 file.txt# 提取文件的第一列以外的所有列：cut -f 2 --complement file.txt

4.3 sort命令

sort命令用于对文本文件进行排序，默认以字母排序。

#基本格式#
sort [选项] file

#常用选项#
-b 忽略行首空白字符
-r 以倒序方式进行排序
-f 忽略大小写进行排序
-n 按照数值大小进行排序
-u 去除重复行
-t 指定字段分隔符
-k 指定按照字段排序

4.4 uniq命令

uniq 命令用于找出或删除文本文件中连续出现的重复行。

#基本格式#
uniq [选项] [输入文件 [输出文件]]#如果不指定输入文件，则会从标准输入获取数据
#如果不指定输出文件，则结果会打印到标准输出

#常用选项#-c  在输出结果中显示每行重复出现的次数。
-d  只显示重复行。
-u  只显示不重复的行。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/88239.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Shell编程之正则表达式（非常详细）

正则表达式

1.通配符和正则表达式的区别

2.基本正则表达式

2.1 元字符（字符匹配)

2.2 表示匹配次数

2.4 位置锚定

2.5 分组和或者

3.扩展正则表达式

4.部分文本处理工具

4.1 tr 命令

4.2 cut命令

4.3 sort命令

4.4 uniq命令

相关文章

Ansible从入门到精通【六】

闭环控制方法及其应用：优缺点、场景和未来发展

释放AI创作潜能：从大模型训练到高产力应用

苹果电脑图像元数据编辑器：MetaImage for Mac

东南大学齿轮箱故障诊断（Python代码，MSCNN结合LSTM结合注意力机制模型，代码有注释）

基于Matlab实现心电信号小波特征提取和对应疾病识别仿真（附上源码+数据集）

运维监控学习笔记3

如何让ES低成本、高性能？滴滴落地ZSTD压缩算法的实践分享

CCLINK IE 转MODBUS-RTU网关modbusrtu与485区别

Python Opencv实践 - 图像属性相关

JProfiler —CPU评测

Mac如何打开隐藏文件中Redis的配置文件redis.conf

《Zookeeper》源码分析（九）之选举通信网络

解决selenium的“can‘t access dead object”错误

21 | 朝阳医院数据分析

C++ 虚继承

约束综合中的逻辑互斥时钟(Logically Exclusive Clocks)

【Linux】程序地址空间

【Megatron-DeepSpeed】张量并行工具代码mpu详解(四)：张量并行版Embedding层及交叉熵的实现及测试

测试老鸟经验总结，Jmeter性能测试-重要指标与性能结果分析（超细）

Shell编程之正则表达式（非常详细）

正则表达式

1.通配符和正则表达式的区别

2.基本正则表达式

2.1 元字符 （字符匹配)

2.2 表示匹配次数

2.4 位置锚定

2.5 分组 和 或者

3.扩展正则表达式

4.部分文本处理工具

4.1 tr 命令

4.2 cut命令

4.3 sort命令

4.4 uniq命令

相关文章

2.1 元字符（字符匹配)

2.5 分组和或者