标准C++ 字符串

一、标准库中的字符串类型

在C++中,字符串是一个非常重要的数据类型,用于表示和处理文本信息。C++提供了多种方式来处理字符串,每种方式都有其特点和适用场景。以下是几种常见的字符串类型及其用法:

1. C 风格字符串 (char*char[])

C 风格字符串是最基础的字符串表示方式,它是一个以空字符 \0 结尾的字符数组。

char str1[] = "Hello, World!";
char* str2 = "Hello, World!";

特点:

  • 直接使用字符数组,简单高效。
  • 没有内置的长度检查,容易发生缓冲区溢出等问题。
  • 需要手动管理内存。

示例:

#include <iostream>
#include <cstring> // for strlen, strcpy, etc.int main() {char str1[] = "Hello, World!";char str2[50];std::cout << "Length of str1: " << strlen(str1) << std::endl;strcpy(str2, str1); // Copy str1 to str2std::cout << "str2: " << str2 << std::endl;return 0;
}

2. std::string(C++ 标准库)

C++标准库中的<string>头文件定义了std::string类,提供了丰富的成员函数和操作符重载,使得字符串处理更加方便和安全。

#include <string>
#include <iostream>int main() {std::string str1 = "Hello, World!";std::string str2 = str1 + " How are you?";std::cout << "str1: " << str1 << std::endl;std::cout << "str2: " << str2 << std::endl;std::cout << "Length of str2: " << str2.length() << std::endl;return 0;
}

特点:

  • 类型安全:避免缓冲区溢出等安全问题。
  • 动态管理内存,不需要手动释放。
  • 提供了丰富的成员函数,如 length(), substr(), find(), replace() 等。
  • 支持字符串拼接、比较等操作。
  • 支持移动语义,允许更高效地处理临时字符串。
  • 可以从其他字符串、字符数组、字符指针以及初始化列表构造字符串。
  • C++ 新增成员函数
  •   `shrink_to_fit()`:减少内存使用,将容量减少到与大小相同。
    
  •   `to_string()`:将数值类型转换为字符串。
    
  •   `stoi()`, `stol()`, `stoll()`, `stof()`, `stod()`, `stold()`:字符串到数值的转换函数。
    

3. 字符串字面量

C++ 11引入了原始字符串字面量,它允许字符串字面量包含任意字符,包括换行符、制表符和引号,而不需要进行转义。原始字符串字面量以 R"(...)" 的形式书写,例如:

const char* raw_str = R"(Hello "World"
This is a raw string literal)";

4. 宽字符字符串1 wchar_t*wchar_t[]

宽字符字符串用于处理多字节字符集,如 Unicode。它们使用 wchar_t 类型来存储字符。

wchar_t wstr1[] = L"Hello, World!";
wchar_t* wstr2 = L"Hello, World!";

特点:

  • 每个字符占用多个字节,适合处理多字节字符集。
  • 使用 wchar_t 类型,需要特殊的函数来处理,如 wcslen, wcscpy 等。

示例:

#include <iostream>
#include <cwchar> // for wcslen, wcscpy, etc.int main() {wchar_t wstr1[] = L"Hello, World!";wchar_t wstr2[50];std::wcout << L"Length of wstr1: " << wcslen(wstr1) << std::endl;wcscpy(wstr2, wstr1); // Copy wstr1 to wstr2std::wcout << L"wstr2: " << wstr2 << std::endl;return 0;
}

5. 宽字符字符串2 std::wstring

std::wstringstd::string 的宽字符版本,用于处理宽字符字符串。

#include <string>
#include <iostream>int main() {std::wstring wstr1 = L"Hello, World!";std::wstring wstr2 = wstr1 + L" How are you?";std::wcout << L"wstr1: " << wstr1 << std::endl;std::wcout << L"wstr2: " << wstr2 << std::endl;std::wcout << L"Length of wstr2: " << wstr2.length() << std::endl;return 0;
}

Unicode 字符串字面量

C++ 11支持Unicode字符串字面量,允许使用 Unicode 字符集编写字符串字面量。可以使用 u8 前缀表示UTF-8编码,u 前缀表示UTF-16编码,U 前缀表示UTF-32编码。例如:

const char* utf8_str = u8"Hello, 世界"; // UTF-8
const char16_t* utf16_str = u"Hello, 世界"; // UTF-16
const char32_t* utf32_str = U"Hello, 世界"; // UTF-32

特点:

  • 动态管理内存,不需要手动释放。
  • 提供了丰富的成员函数,如 length(), substr(), find(), replace() 等。
  • 支持宽字符字符串的拼接、比较等操作。

6. std::u16stringstd::u32string

从 C++11 开始,标准库引入了 std::u16stringstd::u32string,分别用于处理 16 位和 32 位的 Unicode 字符串。

#include <string>
#include <iostream>int main() {std::u16string u16str1 = u"Hello, World!";std::u32string u32str1 = U"Hello, World!";std::cout << "u16str1: " << std::wstring_convert<std::codecvt_utf8_utf16<char16_t>, char16_t>().to_bytes(u16str1) << std::endl;std::cout << "u32str1: " << std::wstring_convert<std::codecvt_utf8<char32_t>, char32_t>().to_bytes(u32str1) << std::endl;return 0;
}

特点:

  • 分别使用 char16_tchar32_t 类型来存储字符。
  • 适用于处理 UTF-16 和 UTF-32 编码的字符串。
  • 需要使用 std::wstring_convert 进行编码转换。

总结

  • C 风格字符串:简单高效,但容易出错。
  • std::string:功能丰富,使用方便,安全性高。
  • 宽字符字符串:适用于多字节字符集,如 Unicode。
  • std::wstringstd::string 的宽字符版本。
  • std::u16stringstd::u32string:适用于 UTF-16 和 UTF-32 编码的字符串。

选择合适的字符串类型取决于你的具体需求,例如是否需要处理多字节字符集、是否需要更高的安全性等。

二、 常用字符串操作

以下是一些常用的字符串操作:

  • 构造和赋值:

    std::string str1 = "Hello";
    std::string str2(str1); // 拷贝构造
    std::string str3 = str1 + ", World!"; // 字符串连接
    
  • 长度和容量:

    size_t length = str.length(); // 或 str.size()
    size_t capacity = str.capacity();
    
  • 修改字符串:

    str.append("append this"); // 在末尾添加字符串
    str.insert(7, "inserted "); // 在指定位置插入字符串
    str.erase(5, 3); // 删除指定位置的字符
    str.replace(5, 3, "replaced"); // 替换指定位置的字符
    
  • 查找和比较:

    size_t found = str.find("World"); // 查找子串
    bool equal = (str1 == str2); // 比较字符串
    
  • 子串提取:

    std::string substr = str.substr(7, 5); // 提取子串
    
  • 字符访问:

      std::string str = "Hello, World!";// 通过索引访问字符串中的字符for (size_t i = 0; i < str.size(); ++i) {std::cout << "Character at index " << i << " is: " << str[i] << std::endl;}
    
  • 字符串流:
    C++还提供了字符串流(std::istringstreamstd::ostringstreamstd::stringstream),可以用于字符串的格式化输入输出操作。

#include <sstream>
std::ostringstream oss;
oss << "Hello" << ", " << "World!";
std::string formatted_str = oss.str();

这些是C++中处理字符串的基本方式。在实际编程中,std::string因其易用性和安全性而成为处理字符串的首选方式。

std::getline 的增强

std::getline 函数现在可以接受任何输入流和字符串,而不仅仅是 std::string。这使得从流中读取数据更加灵活。

正则表达式库

C++ 11引入了 <regex> 库,它提供了一种使用正则表达式处理字符串的方式。这个库包括正则表达式类型 std::regex 和用于匹配、查找和替换的函数。

自动类型推导

C++ 11引入了 auto 关键字,可以用于自动推导变量的类型,这在处理字符串迭代器时非常有用,因为它们通常很长且难以记忆。

for (auto it = str.begin(); it != str.end(); ++it) {// 使用迭代器
}

以上是C++ 11中字符串相关的一些主要特性。这些特性极大地提高了字符串处理的灵活性和便利性,使得C++在文本处理方面的能力得到了显著增强。

std::string 的编码格式

std::string 是 C++ 标准库中的一个类,用于表示和处理字符串。在 std::string 中,字符串的编码格式并不是由 std::string 类本身决定的,而是由字符串中存储的数据和程序解释这些数据的方式决定的。
以下是一些关于 std::string 编码格式的要点:

  1. 字符类型std::string 存储的是一系列字符,这些字符默认是 char 类型。在大多数系统上,char 是一个字节(8位),并且可以用来存储 ASCII 编码的字符。
  2. ASCII 编码:如果 std::string 仅包含 ASCII 字符(即字符值在 0 到 127 之间),则它通常被解释为 ASCII 编码。ASCII 是一个单字节编码方案,能够表示英文字母、数字和一些特殊符号。
  3. 扩展 ASCII 编码:有时 std::string 可能包含扩展 ASCII 字符(字符值在 128 到 255 之间),这取决于系统的本地编码设置。扩展 ASCII 允许表示更多的字符,例如重音符号和其他语言的一些字符。
  4. 多字节编码:如果 std::string 用于表示非 ASCII 字符,如 Unicode 字符,那么字符串可能使用多字节编码方案,如 UTF-8、UTF-16 或 UTF-32。在这些编码方案中,不同的字符可能占用不同数量的字节。
    • UTF-8:是一种变长编码,使用 1 到 4 个字节表示一个 Unicode 字符。它是网络传输中最常用的编码格式,并且与 ASCII 编码向后兼容。
    • UTF-16:是另一种变长编码,使用 2 或 4 个字节表示一个 Unicode 字符。
    • UTF-32:使用固定 4 个字节表示一个 Unicode 字符。
  5. 编码的独立性std::string 类本身并不关心字符串内部的编码格式。当你在 std::string 中存储字符时,它仅仅是将这些字符作为字节序列来处理。因此,如果需要处理特定的编码格式,程序员需要确保正确地编码和解码字符串。
  6. 编码转换:在实际应用中,你可能需要将 std::string 从一种编码转换为另一种编码。这通常需要使用专门的库,如 ICU(International Components for Unicode)或者 C++11 以后的标准库中的 <codecvt> 头文件(尽管 <codecvt> 在 C++17 中已被弃用)。
  7. 字符串字面量:在 C++ 中,字符串字面量(如 "Hello, World!")默认是 ASCII 编码的。但是,C++11 引入了 Unicode 字符串字面量,允许使用前缀 u(UTF-16)、U(UTF-32)和 u8(UTF-8)来表示不同编码的字符串。
    总之,std::string 的编码格式取决于你的程序如何解释存储在其中的字节序列,而 std::string 类本身并不强制或假设任何特定的编码。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/470957.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

远离生成式AI大乱斗,SAS公司揭示亚太区千亿AI市场蓝图

生成式AI正在亚太区引发AI的新一轮风暴。根据市场调查公司IDC的一份最新调研&#xff0c;43%的亚太区企业将在未来12个月增加20%的AI投资&#xff0c;其中有40%的企业期待AI能够带来3倍投资回报。在亚太区&#xff0c;中国企业一马当先&#xff0c;不仅有27%的受访企业将AI用于…

Android Studio 将项目打包成apk文件

第一步&#xff1a;选择Build -> Generate Signed APK 会出现&#xff1a; 我们选择 Create new… 然后选择你要存放密钥的地方 点击ok之后&#xff0c;则选择好了文件&#xff0c;并生成了jks文件了。 点击ok之后&#xff0c; 会出现&#xff1a; 选择release&#xf…

【面试题】发起一次网络请求,当请求>=1s,立马中断

首先这是一个大厂的面试题&#xff0c;是我一个同事跟我说的&#xff0c;具体什么业务场景面试官没说&#xff0c;但我猜测可能是以下几种业务场景&#xff1a; 表单提交&#xff1a;在用户提交表单时&#xff0c;如果请求处理时间过长&#xff0c;可以中断请求并提示用户检查…

从0开始学习Linux——文件管理

往期目录&#xff1a; 从0开始学习Linux——简介&安装 从0开始学习Linux——搭建属于自己的Linux虚拟机 从0开始学习Linux——文本编辑器 从0开始学习Linux——Yum工具 从0开始学习Linux——远程连接工具 从0开始学习Linux——文件目录 从0开始学习Linux——网络配置 从0开…

MySQL系列之如何在Linux只安装客户端

导览 前言Q&#xff1a;如何安装一个Linux环境下的MySQL客户端一、准备文件1. 确认Server版本2. 选择Client安装文件 二、下载并安装1. 下载1.1 寻找文件1.2 文件说明 2. 安装2.1 上传至Linux服务器2.2 执行安装 三、连接验证1. 确认远程授权2. 建立远程连接 结语精彩回放 前言…

虚幻引擎 CEO 谈元宇宙:发展、策略与布局

在当今科技领域&#xff0c;元宇宙无疑是最热门的话题之一。Epic Games 首席执行官 Tim Sweeney 对元宇宙的未来发展充满信心&#xff0c;他认为开放元宇宙将融合娱乐、游戏和科技产业&#xff0c;带来一个光明的未来。本文将深入探讨采访中的关键内容&#xff0c;分析元宇宙的…

【R78/G15 开发板测评】串口打印 DHT11 温湿度传感器、DS18B20 温度传感器数据,LabVIEW 上位机绘制演化曲线

【R78/G15 开发板测评】串口打印 DHT11 温湿度传感器、DS18B20 温度传感器数据&#xff0c;LabVIEW 上位机绘制演化曲线 主要介绍了 R78/G15 开发板基于 Arduino IDE 环境串口打印温湿度传感器 DHT11 和温度传感器 DS18B20 传感器的数据&#xff0c;并通过LabVIEW上位机绘制演…

quartz

理论知识&#xff1a; 堆&#xff1a;堆是一颗安全二叉树&#xff0c;是一种特殊的树结构&#xff0c;它的每一个节点值都要比父节点要么大&#xff0c;要么小 小顶堆&#xff1a;最小的值放在最上面&#xff0c;每个子节点都比父节点大 大顶堆&#xff1a;最大的值放在最上…

提取神经网络数学表达式

来自《老饼讲解神经网络》 www..bbbdata.com 当我们在matlab训练好网络后&#xff0c;可以使用神经网络工具箱的sim(net,x)函数进行预测输出。但往往想提取出它的数学表达式&#xff0c;该怎么提取呢&#xff1f; 下面以《一个简单的神经网络例子》中的模型为例&#xff0c;提取…

Vue 的生命周期函数 和 Vuex

创建一个 Vue 实例 每个 Vue 应用都是通过用 Vue 函数创建一个新的 Vue 实例开始的&#xff1a; var vm new Vue({// 选项 })虽然没有完全遵循 MVVM 模型&#xff0c;但是 Vue 的设计也受到了它的启发。因此在文档中经常会使用 vm (ViewModel 的缩写) 这个变量名表示 Vue 实…

使用etl工具kettle的日常踩坑梳理之二、从Hadoop中导出数据

想操作MySQL等关系型数据库的可以访问我上一篇文章&#xff0c;本章主要介绍操作Hadoop等大数据组件。 根据2024年11月份测试了kettle工具在9.3及以上版本已经没有内置连接大数据(如Hadoop)组件了。 建议安装9.2及以下的&#xff0c;我这里送上8.3.0版本的请用百度网盘下载链…

新版 idea 编写 idea 插件时,启动出现 ClassNotFound

IntelliJ IDEA 2024.1.6 (Ultimate Edition) Build #IU-241.19072.14, built on August 8, 2024 Licensed to Sophia Tout Subscription is active until June 29, 2025. For educational use only. Runtime version: 17.0.111-b1207.30 amd64 Kotlin: 241.19072.14-IJ 新版本…

Java面向对象编程进阶之包装类

Java面向对象编程进阶之包装类 一、为什么要使用包装类二、掌握基本数据类型与包装类之间的转换1、为什么需要转换&#xff1f;2、如何转换&#xff1f; 三、String与基本数据类型、包装类之间的转换1、案例2、特别注意 一、为什么要使用包装类 为了使得基本类型的数据变量具备…

【mysql】使用宝塔面板在云服务器上安装MySQL数据库并实现远程连接

前言 使用宝塔Linux面板安装MySQL数据库并实现远程连接 使用宝塔面板安装mysql 宝塔面板&#xff0c;华为云开放3306端口 一些命令 // 命令行连接数据库 mysql -uroot -p // MySQL 5 版本 GRANT ALL ON *.* TO root% IDENTIFIED BY 替换成你的root密码 WITH GRANT OPTION; // …

性能测试|JMeter接口与性能测试项目

前言 在软件开发和运维过程中&#xff0c;接口性能测试是一项至关重要的工作。JMeter作为一款开源的Java应用&#xff0c;被广泛用于进行各种性能测试&#xff0c;包括接口性能测试。本文将详细介绍如何使用JMeter进行接口性能测试的过程和步骤。 JMeter是Apache组织开发的基…

OpenGL ES 共享上下文实现多线程渲染

OpenGL ES 共享上下文时,可以共享哪些资源? 共享上下文实现多线程渲染 EGL 概念回顾 EGL 是 OpenGL ES 和本地窗口系统(Native Window System)之间的通信接口,它的主要作用: 与设备的原生窗口系统通信; 查询绘图表面的可用类型和配置; 创建绘图表面; 在OpenGL ES 和…

应用于新能源汽车NCV4275CDT50RKG车规级LDO线性电压调节器芯片

关于车规级芯片&#xff08;Automotive Grade Chip&#xff09;&#xff0c;车规级芯片是专门用于汽车行业的芯片&#xff0c;具有高可靠性、高稳定性和低功耗等特点&#xff0c;以满足汽车电子系统的严格要求。这些芯片通常用于车载电子控制单元&#xff08;ECU&#xff09;和…

MQTT协议解析 : 物联网领域的最佳选择

1. MQTT协议概述 1.1 MQTT协议是什么 MQTT : Message Queuing Telemetry Transport 模式 : 发布 / 订阅主题优点 : 代码量小、低带宽、实时可靠应用 : 物联网、小型设备、移动应用MQTT 常用端口 : 1883 MQTT是一个网络协议&#xff0c;和HTTP类似&#xff0c;因为轻量简单&…

【OH】openHarmony开发环境搭建(基于windows子系统WSL)

前言 本文主要介绍基于windows子系统WSL搭建openHarmony开发环境。 WSL与Vmware虚拟机的区别&#xff0c;可以查看WSL与虚拟机的区别 更详细的安装配置过程可参考微软官网&#xff1a; ​安装 WSL 前提 以下基于windows 111专业版进行配置&#xff0c;windows 10应该也是可以…

豆瓣均分9:不容错过的9本大模型入门宝藏书籍,非常详细收藏我这一篇就够了

在这个大模型风起云涌的时代&#xff0c;技术的边界被不断拓宽&#xff0c;AI的力量正以前所未有的方式重塑我们的世界。如果你渴望站在技术的浪尖&#xff0c;深入了解增强现实&#xff08;AR&#xff09;、机器学习&#xff08;ML&#xff09;与强化学习&#xff08;RL&#…