用c++实现串匹配问题、选择排序

5.2.2 串匹配问题

【问题】 给定两个字符串S和T,在主串S中查找子串T的过程称为串匹配(string matching,也称模式匹配),T称为模式。在文本处理系统、操作系统、编译系统、数据库系统以及 Internet 信息检索系统中,串匹配是使用最频繁的操作。串匹配问题具有两个明显的特征:①问题规模很大,常常需要在大量信息中进行匹配,因此,算法的一次执行时间不容忽视;②匹配操作执行频率高,因此,算法改进所取得的效益因积累往往比表面上看起来要大得多。


应用实例        在 Word等文本编辑器中有这样一个功能:在“查找”对话框中输入待查找内容(常见的是查找某个字或词),编辑器会在整个文档中进行查找,将与待查找内容相匹配的部分高亮显示,
【想法1】 应用蛮力法解决串匹配问题的过程是:从主串 S 的第一个字符开始和模式T的第一个字符进行比较,若相等,则继续比较二者的后续字符;若不相等,则从主串S的第二个字符开始和模式T的第一个字符进行比较。重复上述过程,若T中的字符全部比较完毕,则说明本趟匹配成功;若 S中的字符全部比较完毕,则匹配失败。这个算法称为朴素的模式匹配算法,简称 BF算法,如图5-2所示。

设主串 S="abcabcacb",模式 T="abcac", BF算法的匹配过程如图5-3所示。

【算法1】 设字符数组 S 存放主串,字符数组T存放模式, BF算法如下。
算法:串匹配算法 BE 

输人:主串 S,模式 T 

输出:T在S中的位置
1.初始化主串比较的开始位置index=0;
2.在串 S 和串T中设置比较的起始下标i=0,j=0;
3.重复下述操作,直到S或T的所有字符均比较完毕:
3.1 如果 S[i]等于T[j],则继续比较S和T的下一对字符;
3.2 否则,下一趟匹配的开始位置index++,回溯下标i=index,j=0;
4.如果T中所有字符均比较完,则返回匹配开始位置的序号;否则返回0;


【算法分析1】 设主串S长度为n,模式T长度为m,在匹配成功的情况下,考虑最坏情况,即每趟不成功的匹配都发生在串T的最后一个字符。
例如:S= "aaaaaaaaaaab'"
           T="aaab"
设匹配成功发生在si处,则在i-1趟不成功的匹配共比较了(i-1)×m次,第i趟成功的匹配共比较了m次,所以总共比较了ixm次,平均比较次数是:

一般情况下,m<<n, 因此最坏情况下的时间复杂度是O(nXm)。
【算法实现1】设字符数组S和T分别存储主串和模式,程序如下

#include <iostream>
using namespace std;


int BF(char S[ ], char T[ ])
{
int index = 0, i = 0, j = 0;
while ((S[i] != '\0') && (T[j] != '\0'))
{
if (S[i] == T[j]) {i++; j++;}
else {index++; i = index; j = 0; } //i和j分别回溯
}
if (T[j] == '\0') return index + 1; //返回本趟匹配的开始位置
else return 0;
}
int main( )
{
 char S[] = "abcabcacb";
    char T[] = "abcac";
    int index = BF(S, T);
    // 在此处添加你想要执行的其他操作,例如输出匹配结果
    std::cout << "匹配的起始位置:" << index << std::endl;
    return 0;
}

【想法2】 BF算法简单但效率较低, KMP 算法对于BF 算法有了很大改进,基本思想是主串不进行回溯。
        分析BF算法的执行过程,造成 BF算法效率低的原因是回湖,即在某趟匹配失败后对于主串 S要回溯到本趟匹配开始字符的下一个字符,模式T要回溯到第一个字符,而这些回溯往往是不必要的。观察图5-3所示的匹配过程,在第1趟匹配过程中, S[0]~S[3]和T[0]~T[3]匹配成功,S[4]不等于T[4]匹配失败。因为在第1趟中有 S[1]=T[1], 而T[0]不等于T[1], 因此有T[0]不等于S[1], 所以第2趟是不必要的,同理第3趟也是不必要的,可以直接到第4趟。进一步分析第4趟中的第一对字符 S[3]和 T[0]的比较是多余的,因为第1趟中已经比较了 S[3]和 T[3],并且 S[3]=T[3], 而 T[0]=T[3], 因此必有 S[3]=T[0], 因此第4趟比较可以从第二对字符 S[4]和 T[1]开始进行,这就是说,第1趟匹配失败后,下标i不回溯,而是将下标j回溯至第2个字符,从 T[1]和 S[4]开始进行比较。
        综上所述,希望某趟在 S[i]和T[j]匹配失败后,下标i不回溯,下标j回溯至某个位置k,从T[k]和 S[i]开始进行比较。显然,关键问题是如何确定位置k。
        观察部分匹配成功时的特征,某趟在S[i]和 T[j]匹配失败后,下一趟比较从 S[i]和T[k]开始,则有T[0]~T[k-1]=S[i-k]~S[i-1]成立,如图5-4(a)所示;在部分匹配成功时,有T[j-k]~T[j-1]-S[i-k]~S[i一1]成立,如图5-4(b)所示。

        由T[0]~T[k-1]=S[i-k]~S[i-1]和T[j-k]~T[j-1]=S[i-k]~S[I-1],可得:

T[0]~ T[k-1]=T[j-k]~ T[j-1]         (5-1)
式(5-1)说明,模式中的每一个字符T[j]都对应一个k值,这个k值仅依赖于模式本身,与主串无关,且 T[0]~T[k-1]是 T[0]~T[j-1]的真前缀, T[j-k]~T[j-1]是T[0]~T[j-1]的真后缀,k是T[0]~T[j-1]的真前缀和真后缀相等的最大子串的长度。用next[j]表示T[j]对应的k值(0<=j<m),定义如下:

设模式 T="ababc",根据 next[j]的定义,计算过程如下:
j=0时, next[0]=-1
j=1时, next[1]=0
j=2时, T[0]≠T[1],则 next[2]=0
j=3时, T[0]T[1]≠T[1]T[2], T[0]=T[2], 则 next[3]=1
j=4时, T[0]T[1]T[2]≠T[1]T[2]T[3], T[0]T[1]=T[2]T[3], 则 next[4]=2
设主串 S="ababaababcb", 模式 T="ababc", 模式T的next值为(-1, 0,0,1, 2), KMP算法的匹配过程如图 5-5 所示。

【算法 2】 在求得了模式T的next值后,KMP算法如下。
算法:串匹配算法 KMP

 输入:主串 S, 模式T

 输出:T在S中的位置
1.在串 S和串T中分别设置比较的起始下标i=0, j=0;
2.重复下述操作,直到S或T的所有字符均比较完毕:
2.1如果 S[i]等于T[j],则继续比较S和T的下一对字符;

2.2 否则,将下标j回溯到 next[j]位置,即j=next[j];
2.3 如果j等于-1,则将下标i和j分别加1,准备下一趟比较;
3.如果T中所有字符均比较完毕,则返回本趟匹配开始位置的序号;否则返回0;
【算法分析 2】 在求得模式T的next值后,KMP算法只需将主串扫描一遍,设主串的长度为n,则KMP算法的时间复杂度是O(n)。
【算法实现2】 设函数 GetNext用蛮力法求得模式 T的 next 值,函数 KMP 实现
KMP算法,程序如下。

#include <iostream>
using namespace std;


void GetNext(char T[ ], int next[ ])
{
int i, j, len;
next[0] = -1;
for (j = 1; T[j]!='\0'; j++) //依次求next[j]
{
for (len = j - 1; len >= 1; len--) //相等子串的最大长度为j-1
{
for (i = 0; i < len; i++) //比较T[0]~T[len-1]与T[j-len]~T[j-1]
if (T[i] != T[j-len+i]) break;
if (i == len) { next[j] = len; break;}
}
if (len < 1) next[j] = 0; //其他情况,无相等子串
}
}

int KMP(char S[ ], char T[ ]) //求T在S中的序号
{
int i = 0, j = 0;
int next[80]; //假定模式最长为80个字符
GetNext(T, next);
while (S[i] != '\0' && T[j] != '\0')
{
if (S[i] == T[j]) {i++; j++; }
else
{
j = next[j];
if (j == -1) {i++; j++;}
}
}
if (T[j] == '\0') return (i - j + 1); //返回本趟匹配的开始位置
else return 0;
}
int main( )
{
 char S[] = "abcabcacb";
    char T[] = "abcac";

    int index = KMP(S, T);

    // 输出匹配结果
    if (index != 0) {
        std::cout << "T 在 S 中匹配的起始位置是:" << index << std::endl;
    } else {
        std::cout << "T 在 S 中没有找到匹配项" << std::endl;
    }

    return 0;
}

5.3.1. 选择排序


【问题】 选择排序(selection sort)的基本思想是(第i趟排序在无序序列,ri~rn中找到值最小的记录,并和第i个记录交换作为有序序列的第i个记录;如图5-6所示。

【想法】 图5-7给出了一个选择排序的例子(无序区用方括号括起来),具体的排序
过程如下。
(1)将整个记录序列划分为有序区和无序区,初始时有序区为空,无序区含有待排序
的所有记录。
(2)在无序区查找值最小的记录,将它与无序区的第一个记录交换,使得有序区扩展一个记录,同时无序区减少一个记录。
(3) 重复执行步骤(2),直至无序区只剩下一个记录

【算法实现】设数组r[n]存储待排序记录序列,注意,数组下标从0开始,则第i个记录存储在r[i-1]中。程序如下。

#include <iostream>
using namespace std;

void SelectSort(int r[ ], int n)
{
int i, j, index, temp;
for (i = 0; i < n - 1; i++) //进行n-1趟选择排序
{
index = i;
for (j = i + 1; j < n; j++) //在无序区中查找最小记录
if (r[j] < r[index]) index = j;
temp = r[i]; r[i] = r[index]; r[index] = temp; //交换记录
}
}
int main( )
{
int r[]={1,6,7,5,3,8,9,2};
    SelectSort(r, 8);
    for (int i = 0; i < 8; i++)
        std::cout << r[i] << " ";
    return 0;
}

【算法分析】算法SelectSort的基本语句是内层循环体的比较语句(r[j]<r[index]),.执行次数为:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/310128.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

分布式系统:缓存与数据库一致性问题

前言 缓存设计是应用系统设计中重要的一环&#xff0c;是通过空间换取时间的一种策略&#xff0c;达到高性能访问数据的目的&#xff1b;但是缓存的数据并不是时刻存在内存中&#xff0c;当数据发生变化时&#xff0c;如何与数据库中的数据保持一致&#xff0c;以满足业务系统…

Linux shell编程学习笔记46:awk命令的由来、功能、格式、选项说明、版权、版本

0 前言 在编写Linux Shell脚本的过程中&#xff0c;我们经常要对Linux命令执行的结果进行分析和提取&#xff0c;Linux也在文本分析和提取这方面提供了不少的命令。比如我们之前研究过的cut命令。 Linux shell编程学习笔记43&#xff1a;cut命令https://blog.csdn.net/Purple…

史上最全excel导入功能测试用例设计(以项目为例)

web系统关于excel的导入导出功能是很常见的&#xff0c;通常为了提高用户的工作效率&#xff0c;在维护系统中的一些数据的时候&#xff0c;批量导入往往比一个一个添加或者修改快很多。针对导入功能的测试&#xff0c;往往会有很多种情况&#xff0c;现在针对平时项目中遇到的…

Excel·VBA二维数组S形排列

与之前的文章《ExcelVBA螺旋数组函数》将一维数组转为二维螺旋数组 本文将数组转为S形排列的二维数组&#xff0c;类似考场座位S形顺序 Function S形排列(ByVal arr, ByVal num_rows&, ByVal num_cols&, Optional ByVal mode$ "row")将数组arr转为num_rows…

Home Assistant OS转 Hassio Supervisor(docker 版本)

这是一个失败案例&#xff0c;请忽略。 原因 HAOS缺点&#xff1a;系统不是很好用&#xff0c;无法满足我在上面使用python开发插件的小需求&#xff08;或许有方法满足&#xff0c;但是我没找到&#xff09;。 HAOS优点&#xff1a;方便安装&#xff0c;配置非常方便。 数据…

UE5学习日记——实现自定义输入及监听输入,组合出不同的按键输入~

UE5的自定义按键和UE4有所不同&#xff0c;在这里记录一下。 本文主要是记录如何设置UE5的自定义按键&#xff0c;重点是学会原理&#xff0c;实际开发时结合实际情况操作。 输入映射 1. 创建输入操作 输入操作并不是具体的按键映射&#xff0c;而是按键的激活方式&#xff0…

面试官:说一说CyclicBarrier的妙用!我:这个没用过...

写在开头 面试官&#xff1a;同学&#xff0c;AQS的原理知道吗&#xff1f; 我&#xff1a;学过一点&#xff0c;抽象队列同步器&#xff0c;Java中很多同步工具都是基于它的… 面试官&#xff1a;好的&#xff0c;那其中CyclicBarrier学过吗&#xff1f;讲一讲它的妙用吧 我&…

音乐文件逆向破解

背景 网易云等在线音乐文件的加密源码都按照一定的规则加密&#xff0c;通过对音乐文件的源码分析转化&#xff0c;有望实现对加密文件的解密 实现内容 实现对加密音乐文件的解密 实现对无版权的音乐文件的转化 实现环境 010editor 010 Editor是一个专业的文本编辑器和十六…

FFmpeg: 自实现ijkplayer播放器--04消息队列设计

文章目录 播放器状态转换图播放器状态对应的消息&#xff1a; 消息对象消息队列消息队列api插入消息获取消息初始化消息插入消息加锁初始化消息设置消息参数消息队列初始化清空消息销毁消息启动消息队列终止消息队列删除消息 消息队列&#xff0c;用于发送&#xff0c;设置播放…

破译验证码reCAPTCHA 之 打码平台

由于登录需要验证码&#xff0c;除了日常的字符串&#xff0b;数字&#xff0c;此时就需要用第三方插件进行破译。 reCaptcha是Google公司的验证码服务&#xff0c;方便快捷&#xff0c;改变了传统验证码需要输入n位失真字符的特点。 1. reCAPTCHA 初识 reCaptcha是Google公司…

1、IPEX-LLM(原名BigDL-LLM)环境配置

IPEX-LLM 是一个为Intel XPU (包括CPU和GPU) 打造的轻量级大语言模型加速库&#xff0c;在Intel平台上具有广泛的模型支持、最低的延迟和最小的内存占用。 您可以使用 IPEX-LLM 运行任何 PyTorch 模型&#xff08;例如 HuggingFace transformers 模型&#xff09;。在运行过程中…

结合创新!ResNet+Transformer,高性能低参数,准确率达99.12%

今天给各位介绍一个发表高质量论文的好方向&#xff1a;ResNet结合Transformer。 ResNet因其深层结构和残差连接&#xff0c;能够有效地从图像中提取出丰富的局部特征。同时&#xff0c;Transformer的自注意力机制能够捕捉图像中的长距离依赖关系&#xff0c;为模型提供全局上…

世界需要和平--中介者模式

1.1 世界需要和平 "你想呀&#xff0c;国与国之间的关系&#xff0c;就类似于不同的对象与对象之间的关系&#xff0c;这就要求对象之间需要知道其他所有对象&#xff0c;尽管将一个系统分割成许多对象通常可以增加其可复用性&#xff0c;但是对象间相互连接的激增又会降低…

MySQL中的存储过程详解(上篇)

使用语言 MySQL 使用工具 Navicat Premium 16 代码能力快速提升小方法&#xff0c;看完代码自己敲一遍&#xff0c;十分有用 拖动表名到查询文件中就可以直接把名字拉进来中括号&#xff0c;就代表可写可不写 目录 1.认识存储过程 1.1 存储过程的作用 1.2 存储过程简介…

【word】文档标题如何自动编号

我在写一个word文档的时候&#xff0c;每一级标题的格式都设置好了&#xff0c;包括字体&#xff0c;大小等等&#xff0c;但是如何自动编号呢&#xff1f; 在写中期报告的时候&#xff0c;我对每一级标题的格式都创建了一个单独的样式&#xff0c;像这样&#xff1a; 对于每一…

数据类型知识

1&#xff0c;介绍 根据数据所占的空间不同&#xff0c;把数据分为不同的数据类型 js的变量数据类型是在程序运行中&#xff0c;靠等号右边数值的值来判断的 js动态变量&#xff0c;里面的数据类型是可以变化的 2.数据类型 1.简单数据类型 程序里面&#xff0c;数字前面有…

plotly绘图——热力图

文章目录 介绍热力图基础热力图代码解释 多热力图代码解释 显示数字的热力图代码解释 介绍 plotly是一个易于使用&#xff0c;功能强大的python绘图库&#xff0c;用于构建可交互式的图表&#xff08;可以自行运行后使用鼠标拖拽图片试试&#xff09;&#xff0c;本系列文章将介…

基于springboot+vue的企业人事管理设计与实现

前言 基于Java的企业人事管理设计与实现&#xff0c;可以让用户在最短的时间里享受到最好的服务&#xff1b;而开发本系统&#xff0c;又能够提高系统整体工作水平&#xff0c;简化工作程序&#xff0c;这对管理员和员工来说都是一件非常乐意的事情。 本系统针对基于Java的企…

(一)Jetpack Compose 从入门到会写

基本概念 Compose 名称由来 众所周知&#xff0c;继承在功能拓展上表现的很脆弱&#xff0c;容易类、函数爆炸&#xff0c;通过代理和包装进行组合会更健壮。 Compose 意为组合&#xff0c;使用上也是把 Compose 函数以 模拟函数调用层级关系的方式 组合到一起&#xff0c;最终…

Vue.js------vue基础

1. 能够了解更新监测, key作用, 虚拟DOM, diff算法2. 能够掌握设置动态样式3. 能够掌握过滤器, 计算属性, 侦听器4. 能够完成品牌管理案例 一.Vue基础_更新监测和key 1.v-for更新监测 目标&#xff1a;目标结构变化, 触发v-for的更新 情况1: 数组翻转情况2: 数组截取情况3…