vector
- 引言(实现概述)
- 接口实现详解
- 默认成员函数
- 构造函数
- 析构函数
- 赋值重载
- 迭代器
- 容量
- size与capacity
- reserve
- resize
- empty
- 元素访问
- 数据修改
- insert
- erase
- push_back与pop_back
- swap
- 模拟实现源码概览
- 总结
引言(实现概述)
在前面,我们介绍了vector的使用:
戳我康vector介绍与使用
在本篇文章中将重点介绍vector的接口实现,通过模拟实现可以更深入的理解与使用vector。
我们可以在网上搜索到vector的实现源码, 与string中使用一个指针指向存储数据的空间,两个整型来刻画size与capacity不同,vector中是通过三个迭代器 _start
、_finish
、_endOfStorage
分别指向数据块的起始位置、有效数据末尾的下一个位置、存储容量末尾的下一个位置来管理数据的。vector中迭代器就是原生指针,本质上就是使用三个指针来管理动态申请的存储数据的空间。
vector是一个类模板,其声明与定义不能分离。我们将模拟实现的vector放在我们创建的命名空间内,以防止与库发生命名冲突。
在vector的模拟实现中,我们只实现一些主要的接口,包括默认成员函数、迭代器、容量、元素访问与数据修改:
接口实现详解
默认成员函数
构造函数
构造函数的模拟实现包括无参构造、n个指定元素构造、迭代器区间构造与拷贝构造:
无参构造:即首先在初始化列表中,将三个属性全部初始化为空指针即可:
vector(): _start(nullptr), _finish(nullptr), _endOfStorage(nullptr){}
n个指定元素构造:
这个重载版本有两个参数,第一个是int
,第二个是const T&
,表示用n
个value
构造vector,第二个参数缺省值为其默认构造T()
首先new
一块大小为n个元素大小的空间,将其赋值给_start
;
然后_finish
的值就是_start + n
, _endOfStorage
的值与_finish
相同;
最后for循环将n
个value
写入空间中:
vector(int n, const T& value = T()) //{_start = new T[n];_finish = _start + n;_endOfStorage = _finish;for (int i = 0; i < n; ++i){*(_start + i) = value;}}
迭代器区间构造:
使用迭代器区间的构造,是一个函数模板,即可以使用其他容器的迭代器区间来构造vector。
这个重载版本的实现有许多方式,这里的实现是偷懒版本的,即首先将三个属性初始化为空指针后,再复用push_back
(后面实现)来将迭代器区间中的元素尾插到新vector中:
template<class InputIterator>vector(InputIterator first, InputIterator last): _start(nullptr), _finish(nullptr), _endOfStorage(nullptr){while (first < last){push_back(*first);++first;}}
拷贝构造:
拷贝构造时,首先将三个属性都初始化为空指针;
然后使用reserve
(后面会实现)将新vector扩容与原vector一致;
最后循环将原vector中的数据拷贝到新vector中即可:
vector(const vector<T>& v): _start(nullptr), _finish(nullptr), _endOfStorage(nullptr){int sz = v.size();reserve(sz);for (int i = 0; i < sz; ++i){*(_start + i) = v[i];}}
析构函数
析构函数即释放动态申请的资源,即delete[] _start
即可,同时可以顺便将三个属性均置空:
~vector(){if (_start != nullptr){delete[] _start;_start = _finish = _endOfStorage = nullptr;}}
赋值重载
在实现赋值运算符重载时,存在深浅拷贝的问题,为了简便我们使用现代版本:
现代版本的参数类型为vector<T>
,而不是引用,这就使得vector对象在传参时会生成一个临时对象,我们将这个临时对象与要替换的对象*this
互换,就实现了将一个对象赋值到了*this
,最后返回*this
即可,临时对象会在函数栈帧销毁时析构(swap后面实现)。
vector<T>& operator= (vector<T> v){swap(v);return *this;}
迭代器
vector的迭代器本质上就是原生指针,所以我们只需要将T*
重命名为iterator
即可实现迭代器,并且具有原生指针的++
、--
、+
、-
、指针相减
等的属性:
typedef T* iterator;typedef const T* const_iterator;
与string部分相同,我们暂时只实现begin
与end
,关于反向迭代器的实现在后面会详细介绍。
begin
返回首元素的地址,end
返回尾元素下一个位置的地址,他们分别重载有const版本:
iterator begin(){return _start;}iterator end(){return _finish;}const_iterator begin() const{return _start;}const_iterator end() const{return _finish;}
容量
size与capacity
之前讲到vector迭代器的底层是原生指针,支持指针减指针的操作。
对于size
即元素的个数,_finish - _start
的值即空间中数据的末尾的下一个位置的指针减首元素位置的指针,即元素个数;
对于capacity
即容量的大小,_endOfStorage - _start
的值即空间末尾下一个位置的指针减首元素位置的指针,即容量大小:
size_t size() const{return _finish - _start;}size_t capacity() const{return _endOfStorage - _start;}
reserve
reserve
用于扩容
对于C++而言,使用new扩容时,必须进行重新开辟空间,将原空间中的元素转移至新空间,最后释放原空间的操作。这样的过程将是十分影响效率的:
在库实现中,当传参的n
大于原容量时,reserve
会实现扩容,小于原容量时,reserve
不进行缩容操作。所以我们模拟实现时,先判断n
是否大于原容量,当大于原容量时在再进行后续操作;
首先new
一块大小为n
个元素大小的空间;
然后就需要挪动数据,需要注意的是,不能使用memcpy
来拷贝数据到新空间中,因为memcpy
是逐字节拷贝,而自定义类型是会有动态申请的资源的,这样在释放原空间时就会使新空间中的属性为野指针,当生命周期结束时释放资源时就会释放野指针从而崩溃。所以我们需要调用operator=
逐一拷贝数据到新空间中,并释放原空间;
最后令_start
指向新空间的首元素,_finish
指向数据的结尾(可以在释放前记录size
的值,此时加上即可),_endOfStorage
指向空间的结尾,即_start + n
:
void reserve(size_t n){if (n > capacity()){T* temp = new T[n];int sz = size();if (sz != 0){ //当T为自定义类型时,memcpy为浅拷贝,temp中的自定义类型的数据与*this是相同的,delete调析构释放原空间就会使temp中数据为野指针//memcpy(temp, cbegin(), sizeof(T) * size()); for (size_t i = 0; i < size(); ++i){*(temp + i) = *(_start + i);}delete[] _start;}_start = temp;_finish = _start + sz;_endOfStorage = _start + n;}}
resize
resize
用于改变元素个数
当n
小于元素个数时,删除多于的元素;n
大于元素个数时,使用指定的元素value
补足(value为缺省参数,缺省值为T()
)
首先判断n
是否大于元素个数,当大于元素个数时还需要进一步判断n
是否大于容量需要扩容;
之后逐一用value
补足,这里同样需要是用operator=
,来避免浅拷贝带来的问题,并调整_finish
的指向;
当小于元素个数时,直接将_finish
的值调整为_start + n
即可:
void resize(size_t n, const T& value = T()){if (n > size()){if (n > capacity()){reserve(n);}int oldSize = size();_finish = _start + n;for (size_t i = oldSize; i < n; ++i){*(_start + i) = value;}}else{_finish = _start + n;}}
empty
empty
用于判断vector是否为空,为空返回true
,否则返回false
。这里复用size
即可,当size
返回0时即为空:
bool empty(){if (size() == 0){return true;}return false;}
元素访问
元素访问即实现operator[]
,可以实现通过下标访问元素:
有两个重载版本即普通对象与const对象。
首先判断pos
是否越界,因为pos
为无符号整型,所以只需要判断_start + pos
是否小于 _finish
即可;
然后直接返回_start + pos
的解引用即可:
T& operator[](size_t pos){assert(_start + pos < _finish);return *(_start + pos);}const T& operator[](size_t pos) const{assert(_start + pos < _finish);return *(_start + pos);}
数据修改
insert
insert
用于在pos
位置插入数据,模拟实现insert
时,我们只实现在pos
位置(迭代器)插入一个元素的情况:
首先判断pos是否越界,没有越界时还需要再判断是否需要扩容;
这里就存在一个问题,在上一篇文章提到了迭代器失效的问题:扩容后,指向原来空间的迭代器pos
就会成为野指针而失效。为解决这个问题,我们可以事先计算pos
对于_start
的相对位置sz
,从而在释放原空间后通过这个相对位置在新空间中重新找到pos
,即_start + sz
;
然后就可以循环将pos
位置及以后的元素逐一向后移动一个元素。这个过程是十分影响效率的;
最后将要插入的元素放在pos
位置,并++_finish
:
iterator insert(iterator pos, const T& x) //pos传参,在reserve后会出现迭代器失效{assert(pos >= _start && pos <= _finish);int sz = pos - _start; if (size() >= capacity()){reserve(capacity() == 0 ? 10 : capacity() * 2);pos = _start + sz; //解决迭代器失效}vector<T>::iterator it = end() - 1;while (it >= pos){*(it + 1) = *it;--it;}*pos = x;++_finish;return _start;}
erase
erase
用于删除一段数据,这里只模拟实现删除pos
位置(迭代器)的一个元素:
首先判断pos
是否越界,如果没有越界再判断容器是否为空,为空就直接返回_start
;
然后循环将pos
后面的元素逐一向前移动一个元素(从后向前覆盖);
最后--_finish
,并返回_start
:
iterator erase(iterator pos){assert(pos >= _start && pos < _finish);if (empty()){return _start;}vector<T>::iterator it = pos + 1;while (it < _endOfStorage){*(it - 1) = *it;++it;}--_finish;return _start;}
push_back与pop_back
由于在任意位置插入与删除十分影响效率,头插与头删更甚,所以库中只提供了尾插与尾删的接口,不用挪动数据使得其效率很高:
模拟实现时其实只需要调用上面实现的insert
与erase
即可:
push_back
即在end()
的位置插入一个元素x
;
pop_back
即在end() - 1
的位置删除一个元素:
void push_back(const T& x){insert(end(), x);}void pop_back(){erase(end() - 1);}
swap
swap
函数用于交换两个对象的数据:
使用算法库中的swap通过创建临时变量交换的话,就会发生多次深拷贝,十分影响效率。
对于vector对象的交换,只需要逐一交换他们的三个属性即可:
void swap(vector<T>& v){std::swap(_start, v._start);std::swap(_finish, v._finish);std::swap(_endOfStorage, v._endOfStorage);}
模拟实现源码概览
(关于反向迭代器的实现在后面会详细介绍,现在可以暂时忽略)
#include<iostream>
#include<cassert>
#include"my_reverse_iterator.h"namespace qqq
{template<class T>class vector{public:/ iterator /////vector的迭代器是一个原生指针 typedef T* iterator;typedef const T* const_iterator;typedef ReverseIterator<iterator, T&, T*> reverse_iterator;typedef ReverseIterator<const_iterator, const T&, const T*> const_reverse_iterator;iterator begin(){return _start;}iterator end(){return _finish;}const_iterator cbegin() const{return _start;}const_iterator cend() const{return _finish;}reverse_iterator rbegin(){return reverse_iterator(end());}reverse_iterator rend(){return reverse_iterator(begin());}/// construct and destroy //vector(): _start(nullptr), _finish(nullptr), _endOfStorage(nullptr){}vector(int n, const T& value = T()) //{_start = new T[n];_finish = _start + n;_endOfStorage = _finish;for (int i = 0; i < n; ++i){*(_start + i) = value;}}template<class InputIterator>vector(InputIterator first, InputIterator last): _start(nullptr), _finish(nullptr), _endOfStorage(nullptr){while (first < last){push_back(*first);++first;}}//vector(const vector<T>& v)//{// _start = new T[v.size()];// _finish = _start + v.size();// _endOfStorage = _start + v.capacity();// // memcpy(begin(), v.cbegin(), sizeof(T) * v.size());//}vector(const vector<T>& v): _start(nullptr), _finish(nullptr), _endOfStorage(nullptr){int sz = v.size();reserve(sz);for (int i = 0; i < sz; ++i){*(_start + i) = v[i];}}vector<T>& operator= (vector<T> v){swap(v);return *this;}~vector(){if (_start != nullptr){delete[] _start;_start = _finish = _endOfStorage = nullptr;}} capacity ///size_t size() const{return _finish - _start;}size_t capacity() const{return _endOfStorage - _start;}bool empty(){if (size() == 0){return true;}return false;}void reserve(size_t n){if (n > capacity()){T* temp = new T[n];int sz = size();if (sz != 0){ //当T为自定义类型时,memcpy为浅拷贝,temp中的自定义类型的数据与*this是相同的,delete调析构释放原空间就会使temp中数据为野指针//memcpy(temp, cbegin(), sizeof(T) * size()); for (size_t i = 0; i < size(); ++i){*(temp + i) = *(_start + i);}delete[] _start;}_start = temp;_finish = _start + sz;_endOfStorage = _start + n;}}void resize(size_t n, const T& value = T()){if (n > size()){if (n > capacity()){reserve(n);}int oldSize = size();_finish = _start + n;for (size_t i = oldSize; i < n; ++i){*(_start + i) = value;}}else{_finish = _start + n;}}///accessT& operator[](size_t pos){assert(_start + pos < _finish);return *(_start + pos);}const T& operator[](size_t pos) const{assert(_start + pos < _finish);return *(_start + pos);}///modify/void push_back(const T& x){insert(end(), x);}void pop_back(){erase(end() - 1);}void swap(vector<T>& v){std::swap(_start, v._start);std::swap(_finish, v._finish);std::swap(_endOfStorage, v._endOfStorage);}iterator insert(iterator pos, const T& x)//pos传参,在reserve后会出现迭代器失效{assert(pos >= _start && pos <= _finish);int sz = pos - _start; if (size() >= capacity()){reserve(capacity() == 0 ? 10 : capacity() * 2);pos = _start + sz; //解决迭代器失效}vector<T>::iterator it = end() - 1;while (it >= pos){*(it + 1) = *it;--it;}*pos = x;++_finish;return _start;}iterator erase(iterator pos){assert(pos >= _start && pos < _finish);if (empty()){return _start;}vector<T>::iterator it = pos + 1;while (it < _endOfStorage){*(it - 1) = *it;++it;}--_finish;return _start;}private:iterator _start; // 指向数据块的开始iterator _finish; // 指向有效数据的尾iterator _endOfStorage; // 指向存储容量的尾};
}
总结
到此,关于vector的主要接口实现就结束了
相信通过接口的模拟实现可以使我们更深入的了解vector
关于STL容器的介绍才刚刚开始,欢迎大家持续关注哦
如果大家认为我对某一部分没有介绍清楚或者某一部分出了问题,欢迎大家在评论区提出
如果本文对你有帮助,希望一键三连哦
希望与大家共同进步哦