目录
1. 为什么学习string类?
1.1 C语言中的字符串
2. 标准库中的string类
2.1 string类(了解)
2.2 string类的常用接口说明
1. string类对象的常见构造
2. string类对象的
3. string类对象的访问及遍历操作
4. string类对象的修改操作
5. string类非成员函数
6. vs和g++下string结构的说明
1. 为什么学习string类?
1.1 C语言中的字符串
C 语言中,字符串是以 '\0' 结尾的一些字符的集合,为了操作方便, C 标准库中提供了一些 str 系列的库函数,
但是这些库函数与字符串是分离开的,不太符合 OOP 的思想,而且底层空间需要用户自己管理,稍不留神可
能还会越界访问。
2. 标准库中的string类
2.1 string类(了解)
1. 字符串是表示字符序列的类
2. 标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作
单字节字符字符串的设计特性。
3. string 类是使用 char( 即作为它的字符类型,使用它的默认 char_traits 和分配器类型 ( 关于模板的更多信
息,请参阅 basic_string) 。
4. string 类是 basic_string 模板类的一个实例,它使用 char 来实例化 basic_string 模板类,并用 char_traits
和 allocator 作为 basic_string 的默认参数 ( 根于更多的模板信息请参考 basic_string) 。
5. 注意,这个类独立于所使用的编码来处理字节 : 如果用来处理多字节或变长字符 ( 如 UTF-8) 的序列,这个
类的所有成员 ( 如长度或大小 ) 以及它的迭代器,将仍然按照字节 ( 而不是实际编码的字符 ) 来操作。
总结:
1. string 是表示字符串的字符串类
2. 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作 string 的常规操作。
3. string 在底层实际是: basic_string 模板类的别名, typedef basic_string<char, char_traits, allocator>
string;
4. 不能操作多字节或者变长字符的序列。
在 使用 string 类时,必须包含 #include 头文件以及 using namespace std ;
2.2 string类的常用接口说明
1. string类对象的常见构造
(图片来源于网图)
2. string类对象的
(图片来源于网图)
注意:
1. size() 与 length() 方法底层实现原理完全相同,引入 size() 的原因是为了与其他容器的接口保持一
致,一般情况下基本都是用 size() 。
2. clear() 只是将 string 中有效字符清空,不改变底层空间大小。
3. resize(size_t n) 与 resize(size_t n, char c) 都是将字符串中有效字符个数改变到 n 个,不同的是当字
符个数增多时: resize(n) 用 0 来填充多出的元素空间, resize(size_t n, char c) 用字符 c 来填充多出的
元素空间。注意: resize 在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大
小,如果是将元素个数减少,底层空间总大小不变。
4. reserve(size_t res_arg=0) :为 string 预留空间,不改变有效元素个数,当 reserve 的参数小于
string 的底层空间总大小时, reserver 不会改变容量大小。
3. string类对象的访问及遍历操作
函数名称功能说明operator[] (重点)返回 pos 位置的字符, const string 类对象调用begin + endbegin 获取一个字符的迭代器 + end 获取最后一个字符下一个位置的迭 代器rbegin + rendbegin 获取一个字符的迭代器 + end 获取最后一个字符下一个位置的迭 代器 范围 forC++11 支持更简洁的范围 for 的新遍历方式
4. string类对象的修改操作
函数名称功能说明push_back在字符串后尾插字符 cappend在字符串后追加一个字符串operator+= ( 重点 )在字符串后追加字符串 strc_str ( 重点 )返回 C 格式字符串fifind + npos ( 重点 )从字符串 pos 位置开始往后找字符 c ,返回该字符在字符串中的位置rfifind从字符串 pos 位置开始往前找字符 c ,返回该字符在字符串中的位置substr在 str 中从 pos 位置开始,截取 n 个字符,然后将其返回
注意:
1. 在 string 尾部追加字符时, s.push_back(c) / s.append(1, c) / s += 'c' 三种的实现方式差不多,一般
情况下 string 类的 += 操作用的比较多, += 操作不仅可以连接单个字符,还可以连接字符串。
2. 对 string 操作时,如果能够大概预估到放多少字符,可以先通过 reserve 把空间预留好。
5. string类非成员函数
(图片来源于网图)
6. vs和g++下string结构的说明
注意:下述结构是在 32 位平台下进行验证, 32 位平台下指针占 4 个字节。
vs 下 string 的结构
string 总共占 28 个字节 ,内部结构稍微复杂一点,先是 有一个联合体,联合体用来定义 string 中字
符串的存储空间 :
当字符串长度小于 16 时,使用内部固定的字符数组来存放
当字符串长度大于等于 16 时,从堆上开辟空间
union _Bxty{ // storage for small buffer or pointer to larger onevalue_type _Buf [ _BUF_SIZE ];pointer _Ptr ;char _Alias [ _BUF_SIZE ]; // to permit aliasing} _Bx ;
这种设计也是有一定道理的,大多数情况下字符串的长度都小于 16 ,那 string 对象创建好之后,内
部已经有了 16 个字符数组的固定空间,不需要通过堆创建,效率高。
其次:还有 一个 size_t 字段保存字符串长度,一个 size_t 字段保存从堆上开辟空间总的容量
最后:还 有一个指针 做一些其他事情。
故总共占 16+4+4+4=28 个字节。
g++ 下 string 的结构
G++ 下, string 是通过写时拷贝实现的, string 对象总共占 4 个字节,内部只包含了一个指针,该指
针将来指向一块堆空间,内部包含了如下字段:
空间总大小
字符串有效长度
引用计数
指向堆空间的指针,用来存储字符串
struct _Rep_base{size_type _M_length ;size_type _M_capacity ;_Atomic_word _M_refcount ;};