Bi-LSTM-CRF实现中文命名实体识别工具(TensorFlow)

项目源码获取方式见文章末尾! 回复暗号:13,免费获取600多个深度学习项目资料,快来加入社群一起学习吧。

                    **《------往期经典推荐------》**

项目名称
1.【MobileNetV2实现实时口罩检测tensorflow】
2.【卫星图像道路检测DeepLabV3Plus模型】
3.【GAN模型实现二次元头像生成】
4.【CNN模型实现mnist手写数字识别】
5.【fasterRCNN模型实现飞机类目标检测】
6.【CNN-LSTM住宅用电量预测】
7.【VGG16模型实现新冠肺炎图片多分类】
8.【AlexNet模型实现鸟类识别】
9.【DIN模型实现推荐算法】
10.【FiBiNET模型实现推荐算法】
11.【钢板表面缺陷检测基于HRNET模型】

更多干货内容持续更新中…


1. 项目简介

本项目旨在开发一个基于深度学习的中文命名实体识别(Named Entity Recognition, NER)系统。命名实体识别是自然语言处理(Natural Language Processing, NLP)领域的重要任务之一,广泛应用于信息提取、文本分类、知识图谱构建等多个场景中。项目采用了双向长短时记忆网络(BiLSTM)与条件随机场(CRF)模型相结合的架构,通过深度学习模型自动学习文本中的实体边界和类型。该模型能够识别出三种类型的命名实体:人名、地名和组织名,并基于TensorFlow框架实现。中文NER具有独特的挑战,如缺乏显式的词边界以及实体上下文依赖较强,本项目通过对上下文信息的捕捉以及序列标注的优化来提升识别的准确性。最终目标是开发一个性能稳定、可扩展、易于部署的中文命名实体识别系统,为中文信息处理提供可靠的基础模块。

2.技术创新点摘要

  1. BiLSTM-CRF 模型架构的优化:项目采用了双向长短时记忆网络(BiLSTM)与条件随机场(CRF)相结合的模型架构。BiLSTM用于捕捉输入文本的上下文信息,使模型能够更好地理解中文字符间的依赖关系,而CRF则在输出层进行序列标注的全局优化,确保每个实体标注的逻辑连贯性,避免标注错误。该架构在命名实体识别任务中比传统的LSTM和CNN模型表现更好,能够捕捉更复杂的上下文模式。
  2. 嵌入层的灵活配置与更新策略:在嵌入层设计上,本项目允许选择使用预训练的字符嵌入(embedding)或随机初始化的嵌入向量,并提供了更新嵌入的选项(update_embedding),使得模型能够动态调整嵌入向量以适应具体任务场景。这种灵活的嵌入策略使得模型能够更好地处理不同来源的文本数据,适应不同的应用场景。
  3. 梯度裁剪与自适应学习率策略:模型训练过程中使用了梯度裁剪(gradient clipping)策略,有效避免了梯度爆炸问题,确保了模型的训练稳定性。同时,项目提供了多种优化器(如Adam、SGD等)的选择,并在学习率上采用了自适应调整策略(learning rate scheduling),能够根据训练过程中损失的变化动态调整学习率,提高模型的收敛速度。
  4. 基于序列长度的动态批量处理:模型在输入层使用了动态批量(batch dynamic)设计,根据每个输入序列的实际长度进行填充处理,确保了模型能够高效处理不同长度的句子,降低了不必要的计算量,提高了训练和预测的效率。

在这里插入图片描述

3. 数据集与预处理

本项目使用的中文命名实体识别数据集主要来自公开的CoNLL-2003标准数据格式。数据集中的每个句子都被标注为三种命名实体类别:人名(PER)、地名(LOC)和组织名(ORG),并且遵循BIO标注格式,即实体前标有“B-”表示实体的开始,“I-”表示实体的中间部分,“O”则表示非实体部分。数据集中每个标注行包含了词汇和对应的标签,整体数据分为训练集、验证集和测试集。

数据集特点

  • 数据中存在多种字符类型(汉字、英文字符、数字等),需要处理多种类型混合的文本。
  • 命名实体边界较难区分,尤其是在多种语言混杂或字符类型交替时,模型难以精准定位实体的起止位置。
  • 不同实体类型的标签分布不均衡,特别是组织名(ORG)标签数量较少,模型可能出现类别不平衡问题。

数据预处理流程

  1. 数据清洗与分词:首先,对原始文本进行数据清洗,去除无效字符和标点符号,并使用自定义分词工具对文本进行分词处理。分词后,每个词会被转换为唯一的词ID以便输入模型。
  2. 字典构建与标签转换:在数据清洗和分词后,项目根据所有出现的词汇生成词汇表(Vocabulary),并为每个标签创建对应的标签索引(tag2label)。所有句子中的词汇将根据该词汇表转换为词索引,标签也会被转换为标签ID。
  3. 特征工程与填充处理:针对中文文本中的词汇信息,本项目还引入了词嵌入(Word Embeddings)作为附加特征,以提升模型对不同字符含义的理解。同时,针对不同长度的句子,使用了序列填充(Padding)处理,使其能够统一输入到模型中进行训练。
  4. 数据集划分与增强:将原始数据集分为训练集、验证集和测试集,并通过数据增广技术(如随机替换同义词或删除非必要词语)来提升模型的泛化能力。

4. 模型架构

  1. 模型结构的逻辑

本项目采用了基于 双向长短时记忆网络(BiLSTM)和条件随机场(CRF) 的命名实体识别模型架构。其核心组件包括以下几个模块:

  1. 输入嵌入层(Embedding Layer)

    1. 该层将输入的词汇序列转换为词向量表示,并利用词嵌入矩阵对每个词进行查找。
    2. 数学表示: E = W embedding [ X ] E = W_{\text{embedding}}[X] E=Wembedding[X] 其中,Wembedding 是预训练或随机初始化的嵌入矩阵,X 为输入的词序列,E 为对应的嵌入矩阵表示。
  2. BiLSTM 层

    1. 使用了双向 LSTM 单元(前向 LSTM 和后向 LSTM)来捕捉序列的上下文信息。BiLSTM 层能够同时处理前后依赖关系,以获得每个词的更完整表示。
    2. 数学表示:
    3. $$\overrightarrow{h_t} = \text{LSTM}_{\text{fw}}(E_t, \overrightarrow{h_{t-1}})$$
      
    4. h t ← = LSTM bw ( E t , h t + 1 ← ) \overleftarrow{h_t} = \text{LSTM}_{\text{bw}}(E_t, \overleftarrow{h_{t+1}}) ht =LSTMbw(Et,ht+1 )
    5. H t = [ h t → ; h t ← ] H_t = [\overrightarrow{h_t}; \overleftarrow{h_t}] Ht=[ht ;ht ]
    6. 其中, h t → \overrightarrow{h_t} ht h t ← \overleftarrow{h_t} ht 分别为前向和后向 LSTM 的隐状态,Ht 是 BiLSTM 层的输出。
  3. 投影层(Projection Layer)

    1. 该层将 BiLSTM 层输出的隐状态进行线性变换,以得到每个时间步上对所有标签的打分值(logits)。
    2. 数学表示: P t = H t × W + b P_t = H_t \times W + b Pt=Ht×W+b 其中,W 为权重矩阵,b 为偏置项,Pt 为每个时间步上对标签的打分结果。
  4. 条件随机场层(CRF Layer)

    1. 用于处理序列标注任务中的标注依赖关系。通过对整个序列的打分来选择全局最优路径,确保输出标签之间的逻辑一致性。
    2. 目标函数(损失函数): log_likelihood = ∑ i = 1 N ( S ( X , y ) − log ⁡ ∑ y ′ e S ( X , y ′ ) ) \text{log\_likelihood} = \sum_{i=1}^{N} \left( S(X, y) - \log \sum_{y'} e^{S(X, y')} \right) log_likelihood=i=1N S(X,y)logyeS(X,y) 其中,S(X,y) 为输入序列 X 和标签序列 y 的评分函数,N 为序列总数。
  1. 模型的整体训练流程与评估指标
  1. 模型训练流程

    1. 输入准备:将文本数据转换为索引表示,并进行序列填充和标签转换。
    2. 构建图计算模型:通过 add_placeholders() 创建输入占位符,再依次执行嵌入层(lookup_layer_op())、BiLSTM 层(biLSTM_layer_op())、投影层和 CRF 层的操作。
    3. 前向传播:计算输入序列经过 BiLSTM 和投影层后的输出(logits)。
    4. 损失计算:使用 CRF 的 crf_log_likelihood 方法计算真实标签与预测标签的差距,并优化损失。
    5. 梯度裁剪与优化:采用指定的优化器(如 Adam)进行参数更新,并使用梯度裁剪(gradient clipping)避免梯度爆炸。
    6. 模型保存与验证:每轮训练结束后进行模型验证,并根据验证集的损失值保存模型。
  2. 评估指标

    1. 准确率(Accuracy) :评估模型对实体边界及类别预测的准确程度。
    2. 精确率(Precision)、召回率(Recall)与 F1 值:在多标签分类任务中,使用 F1 值作为模型性能的主要衡量标准。
    3. $$\text{Precision} = \frac{TP}{TP + FP}$$
      
    4. Recall = T P T P + F N \text{Recall} = \frac{TP}{TP + FN} Recall=TP+FNTP
    5. F 1 = 2 × Precision × Recall Precision + Recall F1 = \frac{2 \times \text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} F1=Precision+Recall2×Precision×Recall
    6. 通过 conlleval 脚本对命名实体识别的结果进行详细分析,生成最终的评价报告

5. 核心代码详细讲解

  1. 数据预处理和特征工程

代码段:

parser.add_argument('--train_data', type=str, default='data_path', help='train data source')
parser.add_argument('--epoch', type=int, default=40, help='#epoch of training')
parser.add_argument('--update_embedding', type=str2bool, default=True, help='update embedding during training')
parser.add_argument('--pretrain_embedding', type=str, default='random', help='use pretrained char embedding or init it randomly')

解释:

  • 这些参数用于模型的初始化和数据处理:

    • --train_data: 定义训练数据的路径,便于后续读取数据文件。
    • --epoch: 训练的迭代次数,默认为40次。
    • --update_embedding: 是否在训练过程中更新嵌入矩阵。
    • --pretrain_embedding: 指定使用预训练的词向量或随机初始化的嵌入矩阵。

代码段:

word2id = read_dictionary(os.path.join('.', args.train_data, 'word2id.pkl'))
if args.pretrain_embedding == 'random':embeddings = random_embedding(word2id, args.embedding_dim)

解释:

  • read_dictionary 函数用于读取词汇表,将每个词映射到对应的词ID,并生成 word2id 字典。
  • 如果参数 pretrain_embedding 设置为 random,则会使用 random_embedding 函数来生成随机的词嵌入矩阵(随机分配每个词的向量表示)。
  1. 模型架构构建

代码段:

def build_graph(self):self.add_placeholders()self.lookup_layer_op()self.biLSTM_layer_op()self.softmax_pred_op()self.loss_op()self.trainstep_op()

解释:

  • 该函数是模型的核心架构构建函数,依次调用各层模块,完成计算图的搭建。

    • add_placeholders(): 创建输入、标签、序列长度等占位符。
    • lookup_layer_op(): 执行词嵌入查找,将输入转换为嵌入表示。
    • biLSTM_layer_op(): 使用双向 LSTM 处理序列输入,提取上下文特征。
    • softmax_pred_op(): 执行标签的 Softmax 预测(仅在未使用 CRF 时)。
    • loss_op(): 定义损失函数(CRF 损失或 Softmax 损失)。
    • trainstep_op(): 设置优化器和训练步骤。

代码段:

def biLSTM_layer_op(self):with tf.variable_scope("bi-lstm"):cell_fw = LSTMCell(self.hidden_dim)cell_bw = LSTMCell(self.hidden_dim)(output_fw_seq, output_bw_seq), _ = tf.nn.bidirectional_dynamic_rnn(cell_fw=cell_fw,cell_bw=cell_bw,inputs=self.word_embeddings,sequence_length=self.sequence_lengths,dtype=tf.float32)output = tf.concat([output_fw_seq, output_bw_seq], axis=-1)output = tf.nn.dropout(output, self.dropout_pl)

解释:

  • biLSTM_layer_op 是模型的双向 LSTM 层,用于提取序列上下文特征。

    • cell_fwcell_bw 分别为前向和后向的 LSTM 单元。
    • tf.nn.bidirectional_dynamic_rnn: 处理输入嵌入矩阵 self.word_embeddings,根据序列长度 sequence_length 动态调整 LSTM 单元的计算。
    • 最后将前向和后向输出的隐状态拼接起来 tf.concat,并应用 Dropout 操作防止过拟合。
  1. 模型的损失函数与训练步骤

代码段:

def loss_op(self):if self.CRF:log_likelihood, self.transition_params = crf_log_likelihood(inputs=self.logits,tag_indices=self.labels,sequence_lengths=self.sequence_lengths)self.loss = -tf.reduce_mean(log_likelihood)else:losses = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=self.logits,labels=self.labels)mask = tf.sequence_mask(self.sequence_lengths)losses = tf.boolean_mask(losses, mask)self.loss = tf.reduce_mean(losses)tf.summary.scalar("loss", self.loss)

解释:

  • loss_op 函数用于定义模型的损失计算方法。

    • 如果使用 CRF 层:调用 crf_log_likelihood 函数计算条件随机场的对数似然,并返回转移参数 self.transition_params 和对数似然值。
    • 如果不使用 CRF:采用 sparse_softmax_cross_entropy_with_logits 计算交叉熵损失,并对序列长度进行掩码处理(sequence_mask)。
    • 最终通过 tf.reduce_mean 求均值,得到整体的损失值。

代码段:

def trainstep_op(self):with tf.variable_scope("train_step"):self.global_step = tf.Variable(0, name="global_step", trainable=False)optim = tf.train.AdamOptimizer(learning_rate=self.lr_pl)grads_and_vars = optim.compute_gradients(self.loss)grads_and_vars_clip = [[tf.clip_by_value(g, -self.clip_grad, self.clip_grad), v] for g, v in grads_and_vars]self.train_op = optim.apply_gradients(grads_and_vars_clip, global_step=self.global_step)

解释:

  • trainstep_op 定义了模型的训练步骤:

    • 使用 tf.train.AdamOptimizer 定义 Adam 优化器,并基于损失函数 self.loss 计算梯度。
    • 进行梯度裁剪(clip_by_value)以防止梯度爆炸。
    • optim.apply_gradients 将优化后的梯度应用于模型参数,并更新全局步骤 global_step
  1. 模型训练与评估

代码段:

def train(self, train, dev):saver = tf.train.Saver(tf.global_variables())with tf.Session(config=self.config) as sess:sess.run(self.init_op)self.add_summary(sess)for epoch in range(self.epoch_num):self.run_one_epoch(sess, train, dev, self.tag2label, epoch, saver)

解释:

  • train 函数是模型的核心训练流程:

    • 使用 tf.Session 启动 TensorFlow 会话,并运行 self.init_op 进行变量初始化。
    • 调用 run_one_epoch 函数,进行每一轮训练(每个 epoch 处理一次完整的训练集)。

6. 模型优缺点评价

模型优点:

  1. BiLSTM + CRF 的高效结合:模型通过双向 LSTM 提取文本上下文信息,并利用 CRF 层进行全局标注优化,能够有效解决实体边界和标签依赖问题。尤其在处理长文本和复杂依赖关系时,能够提供更高的精度和召回率。
  2. 灵活的嵌入层配置:模型允许使用预训练的词向量或随机初始化的嵌入矩阵,并提供了更新嵌入选项,适应不同类型的数据和任务需求,提高了模型的泛化能力。
  3. 动态序列处理与梯度裁剪:模型通过动态批处理的方式处理不同长度的输入序列,并使用梯度裁剪避免梯度爆炸,确保了训练的稳定性。
  4. 丰富的超参数配置选项:如优化器选择、学习率调整、Dropout 比例、CRF 使用与否等,用户能够根据任务需求灵活配置,进一步提升模型性能。

模型缺点:

  1. 模型训练时间较长:由于 BiLSTM 需要同时处理前向和后向序列,训练和推理时间相对较长,尤其在大规模数据集上,计算开销较大。
  2. 对标签分布不均衡敏感:当某些标签类别样本较少时,模型可能会偏向于预测频率更高的类别,导致少数类别的识别效果不佳。
  3. 模型参数较多,容易过拟合:模型引入了多个层次的 LSTM 和 CRF 参数,若数据量不足或正则化不足,容易导致过拟合。

改进方向:

  1. 模型结构优化:可尝试引入自注意力机制(Self-Attention)或 Transformer 层,进一步增强对长距离依赖的捕捉能力,并提高训练效率。
  2. 超参数优化:采用超参数搜索(如 Grid Search 或 Bayesian Optimization)来自动选择最佳的学习率、LSTM 隐层维度等超参数。
  3. 数据增强方法:增加同义词替换、随机删除等数据增强策略,提升模型对数据多样性的适应能力,从而提高模型的泛化效果。

↓↓↓更多热门推荐:
基于opencv答题卡识别判卷

👍感谢小伙伴们点赞、关注! 如有其他项目需求的,可以在评论区留言,抽空制作更新!
✌粉丝福利:点击下方名片↓↓↓ , 回复暗号:13,免费获取600多个深度学习项目资料,快来加入社群一起学习吧。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/458620.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

关于嵌入式学习的一些短浅经验

一、写在前面 感谢在 10.23,各位大佬对我进行的模拟面试,我也发现了我对知识的不熟练的部分,比如 IPC 方法和线程同步方法的知识。模拟面试第四期-已经拿到大厂 OFFER 的研究生大佬-LINUX 卷到飞起_哔哩哔哩_bilibili 然后,沈阳…

uniapp+uniCloud前端独立开发全栈项目Vue3版本学习路线,轻松开发H5、微信小程序、APP

概述 嗨,大家好,我是爱搞知识的咸虾米,这个学习路线是uniappuniCloud生态开发微信小程序、H5、APP等实战项目,从零基础开始到各种类型的项目案例,使用比较新的vue3语法糖版本,通过前端的技术可以轻松开发上…

微信小程序——消息订阅

首先用到的就是wx.requestSubscribeMessage接口。 注意:用户发生点击行为或者发起支付回调后,才可以调起订阅消息界面 requestSubscribeMessage() {uni.requestSubscribeMessage({tmplIds: [],//需要订阅的消息模板的id的集合,一次调用最多可…

Docker 常用命令全解析:提升对雷池社区版的使用经验

Docker 常用命令解析 Docker 是一个开源的容器化平台,允许开发者将应用及其依赖打包到一个可移植的容器中。以下是一些常用的 Docker 命令及其解析,帮助您更好地使用 Docker。 1. Docker 基础命令 查看 Docker 版本 docker --version查看 Docker 运行…

向量检索学习记录

1、Faiss Faiss是一个用于高效相似搜索和密集向量聚类的库;(支持单个/多个GPU)官方文档:Home facebookresearch/faiss Wiki GitHub 安装(如果编译有问题,有些选项需要关下,比如GPU, Python&a…

从 Hadoop 迁移到数据 Lakehouse 的架构师指南

从 Hadoop 到数据湖仓一体架构的演变代表了数据基础架构的重大飞跃。虽然 Hadoop 曾经以其强大的批处理能力统治着大数据领域,但如今的组织正在寻求更敏捷、更具成本效益和现代化的解决方案。尤其是当他们越来越多地开始实施 AI 计划时。根本没有办法让 Hadoop 为 A…

【福建医科大学附属第一医院-注册安全分析报告】

前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞 …

微信机器人自动回复了解下

现在使用微信来做私域营销和维护客户的非常多,在工作上会频繁地遭遇客户提出的相同问题,当我们的好友数量众多时,手动逐个回复可能会耗费大量的时间。 幸运的是,多微管理系统的自动回复功能为我们带来了福音。帮助咱们解决这一难…

原创作品——GIS和监控软件设计

这套数据可视化大屏软件UI设计旨在提供一个直观、高​‌‌效且易于理解的界面,用于展示和分析大量的能源数据和信息。以下是关于该系统UI设计的详细介绍: 整体布局与设计风格: 界面以蓝色调为主,代表冷静、专业和科技的氛围。 布…

VisualStudio2022配置2D图形库SFML

文章目录 1. 下载安装SFML库2. 创建C项目并配置SFML配置include目录和库目录链接SFML库配置动态链接库 3. 测试 1. 下载安装SFML库 SFML(Simple and Fast Multimedia Library)C库,适合2D游戏和图形界面,提供了以下模块&#xff1…

通过conda install -c nvidia cuda=“11.3.0“ 安装低版本的cuda,但是却安装了高版本的12.4.0

问题 直接通过 conda install -c nvidia cuda"11.3.0"安装得到的却是高版本的 不清楚原理 解决方法 不过我们可以分个安装 runtime toolkit 和 nvcc 安装指定版本的 cudatoolkit 和 nvcc conda install -c nvidia cuda-cudart"11.3.58" conda instal…

电机学习-SVPWM合成原理

一、核心理论 SVPWM 算法的理论基础是平均值等效原理 ,即在一个开关周 T s T_s Ts​内通过对基本电压矢量加以组合,使其平均值与给定电压矢量相等。 引用于《现代永磁同步电机控制原理及MATLAB仿真》 二、合成原理 在扇区 I 为例: 矢量 U o…

【实用知识】Spring Boot 优雅捕捉异常的几种姿势

👉博主介绍: 博主从事应用安全和大数据领域,有8年研发经验,5年面试官经验,Java技术专家,WEB架构师,阿里云专家博主,华为云云享专家,51CTO 专家博主 ⛪️ 个人社区&#x…

【损害和风险评估&坑洼】路面坑洼检测系统源码&数据集全套:改进yolo11-DCNV3

改进yolo11-DLKA等200全套创新点大全:路面坑洼检测系统源码&数据集全套 1.图片效果展示 项目来源 人工智能促进会 2024.10.24 注意:由于项目一直在更新迭代,上面“1.图片效果展示”和“2.视频效果展示”展示的系统图片或者视频可…

【OpenAI】第五节(图像生成)利用 OpenAI 的 DALL·E 实现自动化图像生成:从文本到图像的完整教程

引言 OpenAI 推出的 DALLE 工具因其能够生成令人惊叹的艺术作品而备受瞩目。DALLE 不仅能够生成静态图像,还能根据用户的需求进行风格化处理,创造出独特的艺术作品。通过 OpenAI 的 API,你可以轻松将 DALLE 的强大功能集成到你的 Python 程序…

单反相机内存卡误删照片怎么办?别急,这里有恢复方法

在摄影的世界里,单反相机无疑是众多摄影爱好者与专业摄影师的首选工具。它不仅能够捕捉细腻丰富的画面细节,还提供了高度的操作灵活性和可扩展性。然而,在使用单反相机的过程中,我们难免会遇到一些技术上的困扰,其中之…

【网络面试篇】三次握⼿、四次挥手综述

目录 一、三次握手 1. 过程描述 2. 为什么不是四次握手?为什么不能两次握手? 二、四次挥手 1. 过程描述 2. 为什么是四次挥手? 一、三次握手 1. 过程描述 ① 客户端 向 服务器 发送 SYN 报文、初始化序列号 ISN(seqx&…

自定义鼠标事件在拖拽中的使用

目标: 显示鼠标在容器元素中划过时经过的元素,但是容器内肯能会出现大量元素,所以直接给容器元素添加click事件,通过elementFromPoint的API模拟子元素被点击事件效果 看看效果吧 涉及的重要对象 MousEvent 参考 MDN 相关代码 operateCont…

[项目详解][boost搜索引擎#2] 建立index | 安装分词工具cppjieba | 实现倒排索引

目录 编写建立索引的模块 Index 1. 设计节点 2.基本结构 3.(难点) 构建索引 1. 构建正排索引(BuildForwardIndex) 2.❗构建倒排索引 3.1 cppjieba分词工具的安装和使用 3.2 引入cppjieba到项目中 倒排索引代码 本篇文章,我们将继续项…

C++《vector的模拟实现》

在之前《vector》章节当中我们学习了STL当中的vector基本的使用方法,了解了vector当中各个函数该如何使用,在学习当中我们发现了vector许多函数的使用是和我们之前学习过的string类的,但同时也发现vector当中一些函数以及接口是和string不同的…