【C++ STL】模拟实现 string

标题:【C++ :: STL】手撕 STL _string

@水墨不写bug


(图片来源于网络)


        C++标准模板库(STL)中的string是一个可变长的字符序列,它提供了一系列操作字符串的方法和功能。

        本篇文章,我们将模拟实现STL的string类的部分功能,以增强对STL的熟练度,了解STL容器的工作原理,积累项目经验,也为将来自主实现和改造容器奠定坚实的基础。

        STL的string类是一个模板,而我们为了方便实现,以达到练习的目的,我们暂时先实现一个成员变量为(下图示)的string类。    

char* _str;
size_t _size;//字符串长度,不加上\0
size_t _capacity;

C++ STL的string类提供了以下常用的成员函数和接口:

  1. 构造函数和赋值操作函数接口:

    • 默认构造函数:创建一个空字符串。
    • 带string参数的构造函数:将一个string对象复制到另一个string对象中。
    • 带字符数组参数的构造函数:将字符数组转换为string对象。
    • 带整数参数的构造函数:将整数转换为字符串。
    • 赋值操作符:用另一个string对象、字符数组或字符来赋值。
  2. 访问字符串内容相关函数接口:

    • at():返回指定位置的字符。
    • operator[]:返回指定位置的字符。
    • front():返回第一个字符。
    • back():返回最后一个字符。
    • c_str():返回一个以空字符结尾的字符数组。
  3. 修改字符串内容接口:

    • insert():在指定位置插入字符、字符串或字符数组。
    • erase():删除指定位置的字符。
    • replace():替换指定位置的字符串或字符。
    • append():在字符串末尾添加字符、字符串或字符数组。
    • clear():清空字符串。
  4. 字符串操作接口:

    • size() 或 length():返回字符串的长度。
    • empty():判断字符串是否为空。
    • find():查找指定字符串或字符的位置。
    • substr():返回指定位置和长度的子字符串。
    • compare():比较两个字符串

 (具体用法在上一篇讲解:【Cpp::STL】标准模板库_ string详解) 


(一)头文件

        我们在C语言阶段实现声明和定义分离的时候,只是单一的把函数的定义放在.c(源)文件,把函数的声明,头文件的包含,宏定义等放在.h(头)文件。

        但是,在C++,不仅要遵守以上的规则,由于类的出现,需要域作用限定符(::)来限定方位;由于成员的访问权限的出现,需要考虑访问权限的问题;此外不同类型的成员的定义的位置也有讲究,比如静态成员尽量不要直接定义在头文件中,因为这会引发  多次包含多文件   在链接时的  头文件内的对象的重定义问题。

        本文根据STL标准模板库的功能,给出头文件,包括string类的定义,众多成员函数,部分非成员函数(流插入,流提取的重载),并在后半节详细讲解各个函数的实现思路。

#define _CRT_SECURE_NO_WARNINGS 1
#pragma once
#include<iostream>
#include<cstring>
#include<cassert>
using namespace std;namespace ddsm 
{class string {friend ostream& operator<<(ostream& out, const string& s1);public://迭代器typedef char* iterator;typedef const char* const_iterator;iterator begin();const_iterator begin() const;iterator end();const_iterator end() const;//传参构造,默认构造,给默认值为空串,巧妙string(const char* str = "");string(const string& s);//copy constructor//string& operator=(const string& s);传统写法string& operator=(const char* s);string& operator=(string s);//现代写法//析构~string();//C类型字符串const char* c_str() const;//保留void reserve(int n);string& push_back(const char ch);//尾插字符string& append(const char* str);//尾插字符串string& operator+=(char ch);string& operator+=(const char* str);string& insert(size_t pos, const char ch);string& insert(size_t pos, const char* str);//缺省值代表最一般的情况string& erase(size_t pos = 0,size_t len = npos);//找一个字符size_t find(const char ch, size_t pos = 0);//找一个子串size_t find(const char* str, size_t pos = 0);void swap(string& s);string substr(size_t pos = 0,size_t len = npos);string& clear();private:char* _str;size_t _size;//字符串长度,不加上\0size_t _capacity;//特例,const静态整形对象可声明定义和一,但是可能造成链接时的错误static size_t npos;};istream& operator>>(istream& in, string& s);};

(二)string类的功能实现

(1)默认成员函数

i,构造函数

        我们知道,构造函数的作用是在对象实例化时初始化对象,对于string类对象,含有三个基本成员变量:

        char* _str;size_t _size;//字符串长度,不加上\0size_t _capacity;

        经过分析,我们得知在构造函数内部,需要申请动态的堆区空间给_str;需要根据_str的长度变化来动态更新_size;同时根据申请的动态空间的长度来更新_capacity。

        于是,我们理所当然的想到这样写构造函数:

string::string(const char* str = "")
// 缺省参数为一个空字符串,如果不传参,空字符串就是一个单独的'\0':_size(strlen(str)),_capacity(strlen(str))
{_str = new char[_size + 1];strcpy(_str, str);
}

        但是,这种简单易懂的写法也暴露出了弊端:多次无意义的重复调用strlen,这会造成额外的消耗。于是,为了减少strlen的调用次数,我们考虑这样修改:

        

string::string(const char* str):_size(strlen(str)),_capacity(_size)
{_str = new char[_size + 1];strcpy(_str, str);
}

        这样修改虽然解决了strlen重复无意义调用的问题,但是也带来了新的问题:

程序稳定性下降的问题:

¥¥我们知道:初始化列表的初始化顺序是成员函数在类中的声明顺序:按照此例:

        char* _str;size_t _size;//字符串长度,不加上\0size_t _capacity;

        先初始化_size,再初始化_capacity;在这种背景下,如果代码有一些微小的改变,或许就会造成意想不到的问题。

        如果改变成员变量的顺序,那么初始化列表就会按照不同的顺序初始化。具体来说,如果_capacity在_size之前,初始化列表就会先初始化_capacity:

        char* _str;size_t _capacity;size_t _size;//字符串长度,不加上\0

        这时_size还没有初始化,是随机值,那么就造成了_capacity为随机值的问题。

解决这个问题其实很简单,将对_capacity的初始化放入函数体:

string::string(const char* str)//strlen较低效,调用一次用size记录返回值//size/capacity不包含\0,但是其需要存储:_size(strlen(str))
{_str = new char[_size + 1];_capacity = _size;strcpy(_str, str);
}

        这样就确定了是先初始化_size,再初始化_capacity。¥¥

        (将声明和定义分离,需要将缺省参数放在声明处,同时函数名之前需要加上域作用限定符,表示这个函数在你实现的string类里面声明过。)

ii,析构函数

         析构函数的作用是:清理资源。

由于比较简单,这里直接给出实现:

//析构
string::~string()
{if(_str)delete[] _str;_size = _capacity = 0;_str = nullptr;
}

(函数名之前需要加上域作用限定符,表示这个函数在你实现的string类里面声明过。)

iii,拷贝构造

       拷贝构造,完成创建对象时的初始化。

一般情况下,我们会这样写:

//拷贝构造
string::string(const string& s)
{char* tem = new char[s._capacity+1];//多开一个,存储'\0'strcpy(tem, s._str);delete[] _str;//销毁原空间_str = tem;_size = s._size;_capacity = s._capacity;
}

但是,其实有更简单的写法:

void string::swap(string& s)
{//调用模板swap交换内置类型,损失不大std::swap(_str, s._str);std::swap(_capacity, s._capacity);std::swap(_size, s._size);
}
//拷贝构造的现代写法
string::string(const string& s):_str(nullptr)
{string tem(s._str);swap(tem);
}

仔细分析,我们其实在无形之中让构造函数给我们“打工”了:

string tem(s._str);

就是用拷贝对象的字符串来构造一个tem对象,而这个tem对象就是我们需要的,所以我们实现一个swap函数,将*this与tem完全交换,同时tem在出作用域时也会自动析构,同样也达到了拷贝构造的目的。

iv,赋值重载

赋值重载:实现对象之间的赋值。

我们一般会这样实现:

//赋值重载
string& string::operator=(const char* s)
{int len = strlen(s);char* tem = new char[len + 1];strcpy(tem, s);delete[] _str;_str = tem;_size = _capacity = len;return *this;
}

 但是,同样也有更简单的写法:

void string::swap(string& s)
{//调用模板swap交换内置类型,损失不大std::swap(_str, s._str);std::swap(_capacity, s._capacity);std::swap(_size, s._size);
}//赋值重载的现代写法 
string& string::operator=(string tem)
{//自动调用拷贝构造swap(tem);//出作用域自动完成析构return *this;
}

在无形之中,我们让拷贝构造为我们“打工”。

我们通过传值传参,拷贝构造一个临时对象tem,这个tem就是我们需要的,所以完全交换*this就得到了构造的对象,同时tem出作用域也会自动析构。

(2)迭代器

         对于迭代器,本质上是一个指针,也可以是一个类(对指针的封装),在这里,我们不妨用指针来作为迭代器:

//声明:
typedef char* iterator;
typedef const char* const_iterator;
iterator begin();
const_iterator begin() const;
iterator end();
const_iterator end() const;
    //定义string::iterator string::begin(){return _str;}string::const_iterator string::begin() const{return _str;}string::iterator string::end(){return _str + _size;}string::const_iterator string::end() const{return _str + _size;}

        const迭代器用于const对象调用;普通迭代器用于普通迭代器调用。

普通迭代器可读可写,const迭代器只可读不可写。

(3)容量和长度

 i.reserve()

        改变string的容量,若要求值n大于现在的容量,则容量扩大到n;若要求值小于等于现有容量,则改变容量。

        reserve对于size没有影响,不会改变string的内容。

实现如下:

//保留指定容量,容量只增不减
void string::reserve(int n)
{//要求保留的大于现有容量,需要扩容if (n > _capacity){char* tem = new char[n + 1];// 申请新空间完毕,转移数据strcpy(tem, _str);delete[] _str;_str = tem;_capacity = n;//reserve不改变size}
}

ii,resize()

    //resize()不改变capacity,可能改变sizevoid string::resize(int size,int ch)//size为设定值,_size为现有值{if (size < _size){_size = size;_str[size] = '\0';}else if (size > _size){if (size > _capacity){reserve(size);}int i = _size;while (i != size){_str[i++] = '\0';}_size = size;_str[_size] = '\0';}}

        如果设定值小于现有值,减小_size,相当于截断_str;

        如果设定值等于现有值,不做处理;

        如果设定值大于现有值,有三种情况:

                size <_capacity:        不扩容,并在[ _size,size)之间补0;

                size == _capacity:        不扩容,并在[ _size,size)之间补0;

                size > _capzcity:        扩容,并在[ _size,size)之间补0;

(4)元素访问

 i,operator[]

        下标的随机访问:

//声明
char& operator[](size_t pos);
const char& operator[](size_t pos) const;
//定义
char& string::operator[](size_t pos)
{assert(pos >= 0 && pos < _size);return _str[pos];
}
const char& string::operator[](size_t pos) const
{assert(pos >= 0 && pos < _size);return _str[pos];
}

对于at,front,back可以复用operator[]来实现。

(5)修改方式

i,push_back()

        实现尾插字符,实现如下:

//尾插字符,由于是一个一个插入,扩容不能太频繁,所以采用二倍扩容
string& string::push_back(const char ch)
{if (_size == _capacity)//不一定需要扩容,若长度等于容量,再次插入需要扩容{int Newcapacity = _capacity == 0 ? 4 : 2 * _capacity;reserve(Newcapacity);}//扩容完毕,尾插字符_str[_size++] = ch;_str[_size] = '\0';return *this;
}

        这里使用了一个扩容技巧,就是二倍扩容。

ii,append()

        追加,这里简化为追加一段字符串。

//尾插字符串,直接reserve到指定长度字符串
string& string::append(const char* str)
{int len = strlen(str);if (len + _size > _capacity){reserve(len + _size);//不改变size}//扩容完毕strcpy(_str + _size, str);_size += len;return *this;
}

        首先要先保存原来的len,这样如果需要扩容,在扩容完毕之后,只需更新_size为原_size+=len即可。

        否则,如果不保存len,在需要扩容的情况下,就会出现问题了:

##

()

##

iii,operator+=复用上两函数即可

        尾插一个字符

string& string::operator+=(char ch)
{push_back(ch);return *this;
}

        尾插一个字符串

string& string::operator+=(const char* str)
{append(str);return *this;
}

iv,insert()

        在任意位置插入一个字符

//插入一个字符
//用push_back逻辑来扩容
string& string::insert(size_t pos, const char ch)
{assert(pos >= 0 && pos <= _size);if (_size == _capacity){int Newcapacity = _capacity == 0 ? 4 : 2 * _capacity;reserve(Newcapacity);//不改变size}int end = _size+1;//细节问题,int与size_t参与比较,//int隐式类型转化为size_t//size_t(-1)会变成很大的整数while(end>pos){_str[end] = _str[end-1];--end;}_str[pos] = ch;_size += 1;return *this;
}

         在任意位置插入一个字符串
//插入一个字符串
//用reserve逻辑扩容
string& string::insert(size_t pos, const char* str)
{assert(pos >= 0 && pos <= _size);int len = strlen(str);if (len + _size > _capacity){reserve(len+_size);}int end = _size + len;while (end>pos+len-1){_str[end] = _str[end - len];--end;}memmove(_str + pos, str, len);_size += len;return *this;
}

v,erase()

        在任意位置处删除长度为len的字符串:

string& string::erase(size_t pos, size_t len)//两种情况;删除部分string,pos之后全删
{assert(pos >= 0 && pos <= _size);if ((len == npos) ||(pos + len >= _size))//全删的情况{_str[pos] = '\0';_size = pos;}else//删除部分string{int end = pos + len;while (_str[end]!='\0'){_str[end - len] = _str[end];++end;}_str[end-len] = '\0';}return *this;
}

(6)串操作

i,find()

        找字符

size_t string::find(const char ch, size_t pos)
{for (size_t i = pos; i < _size; ++i){if (_str[i] == ch){return i;}}return npos;
}

        找字符串

        用到了strstr():字符串匹配函数。

size_t string::find(const char* str, size_t pos)
{char* ret = strstr(_str, str);return (size_t)(ret - _str);
}

ii,c_str()

        返回C类型的字符串:

const char* string::c_str() const
{return _str;
}

iii,substr()

        得到字符串的子串:

string string::substr(size_t pos, size_t len){assert(pos >= 0 && pos <= _size);if ((len == npos) || (pos + len >= _size)){string sub(_str + pos);return sub;}else{ string sub;sub.reserve(len);for (size_t i = 0; i < len; ++i){sub._str[i] = _str[pos + i];}sub._str[len] = '\0';sub._size =sub._capacity =  len;return sub;}}

(7)成员常量

//特例,const静态整形对象可声明定义和一,但是可能造成链接时的错误
const static size_t npos = -1;

        无符号整数size_t(-1)是一个很大的整数。

(8)流插入和流提取

i,operator<<()

ostream& operator<<(ostream& out, const string& s)
{for (size_t i = 0; i < s._size; ++i){cout << s._str[i];}cout << endl;return out;
}

ii,operator>>()

        cin的get()函数可以提取空白字符和‘\n’,这也是循环逻辑结束的条件。

//流提取改进,用buf临时数组,防止string频繁扩容
istream& operator>>(istream& in,string& s)
{s.clear();char buff[128] = { 0 };char ch = in.get();int i = 0;while(ch != ' ' && ch != '\n'){buff[i++] = ch;ch = in.get();if (i == 127){buff[i] = '\0';s += buff;i = 0;}}buff[i] = '\0';if (i != 0){s += buff;}return in;
}

        整体使用了用临时栈区数组的方式来减少扩容次数,提高效率。


完~

未经作者同意禁止转载 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/344842.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构---树与二叉树

个人介绍 hello hello~ &#xff0c;这里是 code袁~&#x1f496;&#x1f496; &#xff0c;欢迎大家点赞&#x1f973;&#x1f973;关注&#x1f4a5;&#x1f4a5;收藏&#x1f339;&#x1f339;&#x1f339; &#x1f981;作者简介&#xff1a;一名喜欢分享和记录学习的…

【中国开源生态再添一员】天工AI开源自家的Skywork

刚刚看到《AI高考作文出圈&#xff0c;网友票选天工AI居首》&#xff0c;没想到在Huggingface中发现了Skywork大模型。天工大模型由昆仑万维自研&#xff0c;是国内首个对标ChatGPT的双千亿级大语言模型&#xff0c;天工大模型通过自然语言与用户进行问答式交互&#xff0c;AI生…

Linux系统管理:虚拟机Almalinux 9.4 安装

目录 一、理论 1.Almalinux 二、实验 1.虚拟机Almalinux 9.4 安装准备阶段 2.安装Almalinux 9.4 3.Termius远程连接 一、理论 1.Almalinux (1) 简介 Almalinux是一个开源、社区拥有和管理、免费的企业Linux发行版。专注于长期稳定性&#xff0c;并提供强大的生产级…

机器学习--损失函数

损失函数&#xff08;Loss Function&#xff09;&#xff0c;也称为代价函数&#xff08;Cost Function&#xff09;或误差函数&#xff08;Error Function&#xff09;&#xff0c;是机器学习和统计学中的一个重要概念。它用于量化模型预测值与真实值之间的差异。损失函数的值…

Python一些小操作

矢量图 from matplotlib_inline import backend_inline backend_inline.set_matplotlib_formats(svg)matplotlib中文问题 import matplotlib.pyplot as plt plt.rcParams["font.sans-serif"]["SimHei"] #设置字体 plt.rcParams["axes.unicode_minus…

docker部署redis实践

1.拉取redis镜像 # 拉取镜像 sudo docker pull redis2.创建映射持久化目录 # 创建目录 sudo mkdir -p $PWD/redis/{conf,data}3. 运行redis 容器&#xff0c;查看当前redis 版本号 # 运行 sudo docker run --name redis -d -p 6379:6379 redis # 查看版本号 sudo docker ex…

力扣每日一题129:从根节点到叶子节点的和

题目 中等 相关标签 相关企业 给你一个二叉树的根节点 root &#xff0c;树中每个节点都存放有一个 0 到 9 之间的数字。 每条从根节点到叶节点的路径都代表一个数字&#xff1a; 例如&#xff0c;从根节点到叶节点的路径 1 -> 2 -> 3 表示数字 123 。 计算从根节…

【Java】单例设计模式

单例设计模式简介 目录 1.单例设计模式是什么&#xff1f;2.单例设计模式设计方法饿汉式懒汉式 3.单例设计模式的应用任务管理器(仅有一个页面&#xff0c;不可多开)Runtime运行环境 1.单例设计模式是什么&#xff1f; 设计模式 是解决 特定问题的优秀设计方式之一。 单例设计…

基于springboot的教学管理系统的设计

管理员账户功能包括&#xff1a;系统首页&#xff0c;个人中心&#xff0c;管理员管理&#xff0c;教师管理&#xff0c;学生管理&#xff0c;课程管理 教师账户功能包括&#xff1a;系统首页&#xff0c;个人中心&#xff0c;学生管理&#xff0c;课程管理&#xff0c;课程表信…

LibreOffice电子表格如何实现快速筛选并将结果放到新的工作表

如果是在excel或者wps中&#xff0c;可能大家都习惯了自动筛选&#xff0c;然后复制到新的工作表或者删除掉复制内容的办法。但是在LibreOffice中&#xff0c;经测试&#xff0c;大数据表的删除或者复制是非常慢的。这也是很多人放弃LibreOffice的原因之一。那么我们如何快速筛…

ArcGIS for js 4.x 加载图层

二维&#xff1a; 1、创建vue项目 npm create vitelatest 2、安装ArcGIS JS API依赖包 npm install arcgis/core 3、引入ArcGIS API for JavaScript模块 <script setup> import "arcgis/core/assets/esri/themes/light/main.css"; import Map from arcgis…

关于多线程

并发编程 在计算机的操作系统中,我们了解到了进程管理,有了解到了cpu的特性,核心数和频率,在次之前我们所写的代码都是只用到了一个核心,此时无论你怎么优化代码,最多也只能使用到一个cpu的核心,把这个核心跑满了,其他的核心也是闲着,所以我们可以通过特殊的编写代码,把多个CP…

搭建python虚拟环境,并在VSCode中使用

创建环境 python -m venv E:\python\flask\venv激活环境 运行下图所示的bat文件 退出环境 执行下面的语句 deactivateVSCode中配置&#xff1a; ①使用CTRLshiftp命令&#xff0c;使用CTRLshiftp命令&#xff0c;输入&#xff1a; Python: Select Interpreter②选择之前创建…

数据库-列的完整性约束-概述

引言 我们都知道人以群分 &#xff0c;但分为 若按照 人类的皮肤分类 黄种人&#xff08;其实是西方人定义&#xff09;我们虽然不承认也不否定 &#xff0c;黑皮肤 &#xff0c;棕色人种&#xff08;在南太平洋和西太&#xff09;白种人 排名你懂的 这好像是枚举类型 emm 尴尬…

【线性代数】向量空间,子空间

向量空间 设V为n维向量的集合&#xff0c;如果V非空&#xff0c;且集合V对于向量的加法以及数乘两种运算封闭&#xff0c;那么就称集合V为向量空间 x&#xff0c;y是n维列向量。 x 向量组等价说明可以互相线性表示 向量组等价则生成的向量空间是一样的 子空间 例题18是三位向…

三、【源码】Mapper XML的解析和注册使用

源码地址&#xff1a;https://github.com/mybatis/mybatis-3/ 仓库地址&#xff1a;https://gitcode.net/qq_42665745/mybatis/-/tree/03-parse-mapperXML Mapper XML的解析和注册使用 流程&#xff1a; 1.Resources加载MyBatis配置文件生成Reader字符流 2.SqlSessionFact…

考虑风光场景生成的电动汽车并网优化调度【遗传算法】【IEEE33】

目录 主要内容 部分代码 部分结果 下载链接 主要内容 程序主要内容是考虑风光场景生成的电动汽车并网优化调度&#xff0c;采用的方法如下所述&#xff1a; ①采用蒙特卡洛方法&#xff0c;结合copula函数以及fuzzy-kmeans&#xff0c;获取6个典型风光出力场景&…

【Pytorch】计算机视觉项目——卷积神经网络TinyVGG模型图像分类(如何使用自定义数据集)

目录 一、前言二、工作流程回顾三、详细步骤流程1. 环境配置2. 数据准备数据集下载数据存储结构&路径查看图片 3. 数据转换4. 自定义数据集&#xff08;Custom Dataset &#xff09;4.1 方法一&#xff1a;使用ImageFolder加载数据集信息查看张量转图片创建DataLoader 4.2 …

计算机毕业设计项目、管理系统、可视化大屏、大数据分析、协同过滤、推荐系统、SSM、SpringBoot、Spring、Mybatis、小程序项目编号1-500

大家好&#xff0c;我是DeBug&#xff0c;很高兴你能来阅读&#xff01;作为一名热爱编程的程序员&#xff0c;我希望通过这些教学笔记与大家分享我的编程经验和知识。在这里&#xff0c;我将会结合实际项目经验&#xff0c;分享编程技巧、最佳实践以及解决问题的方法。无论你是…

芯片软件复位的作用

在调试系统或现场使用时&#xff0c;常用软件复位而不是频繁地通过断电来实现复位操作有以下优劣势&#xff1a; 优势&#xff1a; 数据完整性&#xff1a;通过软件复位&#xff0c;系统可以在一个受控的环境中重新启动&#xff0c;确保数据的完整性和一致性&#xff0c;避免…