Chatterbot 打造游戏AI客服机器人

  • 准备工具

1、开发语言:Python3

2、数据库:MongoDB

3、开源框架:Chatterbot  

4、依赖类库:

  1. pip3 install chatterbot
  2. pip3 install spacy
  3. # 需要手动编译安装 en_core_web_sm(使用2.1版本)
  4. pip3 install jieba
  5. pip3 install colorama
  6. pip3 install pymongo 

  • Chatterbot 介绍

About ChatterBot — ChatterBot 1.0.8 documentation 简单来说就是一个对话机器人框架

1、预处理器

对输入的文本作预处理,比如去掉一些不必要的空格

2、逻辑适配器

1)最佳匹配适配器

使用函数将输入语句与已知语句进行比较。一旦找到与输入语句最接近的匹配,它就使用另一个函数来选择该语句的一个已知响应。

2)时间适配器

询问关于当前时间的问题的语句

User: What time is it?

Bot: The current time is 4:45PM.

3)数学适配器

检查给定的语句,以查看它是否包含可以计算的数学表达式。如果存在,则返回包含结果的响应。这个适配器能够处理字和数字运算符的任意组合。

User: What is four plus four?

Bot: (4 + 4) = 8

4)特定响应适配器

如果聊天机器人接收到的输入与为此适配器指定的输入文本匹配,则将返回指定的响应。

如果出现低置信度,则直接返回具体的文本

比如输入人工客服,返回特定的响应:

  1. >>> 人工客服
  2. Robot (1) : 
  3. 您好,正在转接人工客服,请稍后。

3、存储适配器

简单来说,存储适配器提供了一个接口,允许ChatterBot连接到不同的存储技术,不指定默认使用 SQLite 数据库存储聊天记录,会在执行程序的目录生成一个db.sqlite3文件

推荐是使用mongoDB作为存储适配器

还可以使用mysql:

4、过滤器

可以通过过滤器过滤一些非法的输入语句

5、比较算法

可以自定义一个比较算法,最后返回一个0-1之间的得分值

三、Chattbot算法与文本相似度

1、Chatterbot使用的算法

在对话生成方面,ChatterBot 使用了一种基于深度学习的序列到序列模型来生成回答。具体来说,它使用了一种叫做 LSTM(长短时记忆)的神经网络模型,将对话历史和用户输入转化为一个序列,然后根据先前的对话历史来预测下一个可能的回复。

2、文本相似度计算

将问句表示成一个高维向量,因为一段自然语言文本可能包含很多不同的词汇,每个词汇都对应一个维度。

假设我们有以下两句话:

可以请问你多大了吗?

你今年几岁了?

我们已经将它们表示为以下向量:

v1 = [1, 1, 0, 0, 1, 0, 0, 1, 0]

v2 = [0, 1, 1, 1, 1, 0, 0, 1, 0]

可以通过如下公式计算这两个向量的余弦相似度:

cos_sim(v1, v2) = (v1 • v2) / (||v1|| * ||v2||)

 

其中,“•”表示两个向量的点积,表示对应元素相乘之和。而“||v||”表示一个向量的模,即该向量的所有元素平方和的非负平方根。

按照上述公式计算得到两个向量的余弦相似度为 0.5,这说明这两句话在意义上比较相似。当用户输入一句与 v1 向量比较相似的话时,ChatterBot 可以将回答设置为“我的年龄是……”。

余弦相似度的取值范围是 [-1, 1],其中 1 表示两个向量完全相同,-1 表示两个向量方向完全相反,0 表示两个向量互相垂直。

四、利用chatterbot打造AI客服问答机器人

1)准备语料库

第一行为Question,第二行为answer。它支持json,txt,yml各种格式文件,以txt为例子:

比如有以下的一段对话:

Q:我不知道如何安装游戏。

A:您可以在我们的网站上找到安装说明,或者尝试卸载并重新安装游戏。

Q:我忘记了我的游戏账号密码。

A:请尝试通过我们的密码恢复选项重置您的密码。

存为txt格式直接就是:

我不知道如何安装游戏。

您可以在我们的网站上找到安装说明,或者尝试卸载并重新安装游戏。

我忘记了我的游戏账号密码。

请尝试通过我们的密码恢复选项重置您的密码。

这里记录为 corpus.txt 待会用到

2)利用jieba分词工具进行分词

# -*- coding: utf-8 -*-
import jiebafile_path = "corpus.txt"  # 将 your_file_path.txt 替换成您的文件路径
with open(file_path, "r", encoding="utf-8") as f:lines = f.readlines()new_lines = []
for line in lines:if line.strip():  # 判断是否为空行new_lines.append(line)text = ''.join(new_lines)word_list = jieba.cut(text)  # 进行分词
result = " ".join(word_list)  # 将分词结果合并为字符串,以空格隔开file_path = 'corpus_cut.txt'  # 将 your_file_path.txt 替换成您的文件路径
with open(file_path, mode='a', encoding='utf-8') as f:# 写入数据f.write(result+'\n')

官网文档并没有推荐使用jieba分词进行拟合度的优化,为什么要用jieba进行中文分词?

这也是我自己探索出来的,之前没用分词工具的时候,发现拟合度很差,后面猜测是框架的计算对中文不准确,对中文的分词效果很差,导致计算出来的词向量其实是误差很大的。中文没有像英文一样的明显的单词边界,因此需要使用专门的中文分词工具将中文文本分成有意义的词语,这样计算出来的词向量才是比较精准的。

Jieba 分词工具利用了统计算法和规则引擎的结合,通过分析中文文本中每个汉字与周围汉字的关系,来确定最可能的分词结果。这样可以大大提高分词的准确性,从而更好地反映出中文句子的含义。

3)训练数据

# -*- coding: utf-8 -*-
from chatterbot import ChatBot
from chatterbot.trainers import ListTrainer
import chatterbot.comparisons as comparisons
import chatterbot.response_selection as response_selection
import logginglogging.basicConfig(level=logging.INFO)chatbot = ChatBot("Ron", logic_adapters=[{'import_path': 'chatterbot.logic.BestMatch',"statement_comparison_function": comparisons.LevenshteinDistance,"response_selection_method": response_selection.get_first_response,'default_response': 'I am sorry, but I do not understand.','maximum_similarity_threshold': 0.90},{'import_path': 'chatterbot.logic.SpecificResponseAdapter','input_text': '人工客服','output_text': 'Ok, here is a link: http://chatterbot.rtfd.org'}],storage_adapter='chatterbot.storage.MongoDatabaseAdapter',database_uri='mongodb://127.0.0.1:xxxx/chatbot')# 打开并读取 TXT 文件内容
with open('corpus_cut.txt', 'r', encoding='utf-8') as file:conversation = file.readlines()# 创建训练器实例并迭代训练
trainer = ListTrainer(chatbot)
trainer.train(conversation)

ChatterBot 提供了多种存储适配器(Storage Adapter),可以将训练好的模型数据保存到不同的存储介质中,如文本文件、SQLite 数据库、MongoDB 数据库、Redis 队列等。其中,最常用的存储适配器是 JSON 文件和 SQLite 数据库。

如果你使用 SQLite 存储适配器,那么训练好的模型数据就会被保存在 SQLite 数据库文件中;如果你使用 JSON 存储适配器,那么训练好的模型数据就会被保存在 JSON 文件中。在每次启动机器人时,ChatterBot 会自动从指定的存储介质中加载模型数据。

4)通过命令行进行测试

注意要把输入的问句进行分词,然后丢给模型去匹配才能更精准

# -*- coding: utf-8 -*-
from chatterbot import ChatBot
import chatterbot.comparisons as comparisons
import chatterbot.response_selection as response_selectionimport jieba
import time
import colorama
from colorama import Fore,Style
import logginglogging.basicConfig(level=logging.INFO)colorama.init()  # 初始化 colorama,必须先执行chatbot = ChatBot("Ron", logic_adapters=[{'import_path': 'chatterbot.logic.BestMatch',"statement_comparison_function": comparisons.LevenshteinDistance,"response_selection_method": response_selection.get_first_response,'default_response': '无法识别您的问题,可以联系人工客服,请输入"人工客服"四个字','maximum_similarity_threshold': 0.9},{'import_path': 'chatterbot.logic.SpecificResponseAdapter','input_text': '人工客服','output_text': '您好,正在转接人工客服,请稍后。'},{'import_path': 'chatterbot.logic.SpecificResponseAdapter','input_text': '你好','output_text': '你好,我是智能问答机器人,能问有什么可以帮到你?'}],storage_adapter='chatterbot.storage.MongoDatabaseAdapter',database_uri='mongodb://127.0.0.1:27017/chatbot',
)# 轮询对话
while True:try:# 等待用户输入user_input = input('>>> ')if user_input:if user_input != '人工客服':# 获取 chatbot 响应word_list = jieba.cut(user_input)  # 进行分词result = " ".join(word_list)  # 将分词结果合并为字符串,以空格隔开else:result = user_inputbot_response = chatbot.get_response(result)score = bot_response.confidenceresp = bot_response.textresp = resp.replace(" ", "")print(Style.BRIGHT + Fore.BLUE + "Robot " + "("+str(score)+ ") : "+ Fore.RESET+ Style.RESET_ALL)for i in range(len(resp)):print(Fore.YELLOW + resp[:i+1]+ Fore.RESET, end='\r')time.sleep(0.1)print()  # 输出换行符以保证控制台输出完整except (KeyboardInterrupt, EOFError, SystemExit):break

5) 启动mongoDB并查看相关的数据

use chatbot
show collections
db.statements.find()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/64122.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

周记

本周学习情况 学习内容与总结学习目标完成情况及原因下周学习目标与总结 学习内容与总结 本周学习了数组和GitHub,并了解和学习了GitHub的使用方法,同时也见识到其他人的学习情况,看到了自身的不足并且接受了自身的不足。 关于数组&#xff…

java周记_Java学习周记2

面向对象特征之三 多态性,在Java中有两种体现 1.方法的重载(overload)和重写(overwrite) 2.对象的多态性:可以直接应用在抽象类和接口上 Java引用变量有两个类型:编译时类型和运行时类型,编译时类型由声明该变量时使用的类型决定&…

android新闻客户端报告,简易的Android新闻客户端

学完Android基础之后不知道该怎么办?现在开始实战吧! 现在来看看一款简易的Android新闻客户端是怎么做的,当然,获取网络数据的这一部分我是使用别人做好的本地客户端,然后通过组建本地数据库来使用的,这一部…

关于计算机应用技术的周记,计算机应用技术专业实习周记范文

计算机应用技术专业实习周记范文 第1周 作为计算机应用技术专业的大学生,我很荣幸能够进入计算机应用技术专业相关的岗位实习。相信每个人都有第一天上班的经历,也会对第一天上班有着深刻的感受及体会。尤其是从未有过工作经历的职场大学们。 头几天实习…

顶岗周记篇通用计算机,计算机实习周记20篇

2014年 1 月17 日 星期五 实习地点:XXXX 实习主要项目和内容: 这是我实习的第一周,在这一周内因我新来的缘故,只是打字,整理办公室,收集一下一些资料等零事。 主要收获与体会: 春去秋来&#xf…

java实习周记_java程序员的实习周记

java程序员的实习周记 第一周 XML:概念:可扩展的标记语言、优点:结构化,平台、语言无关,标准的 XML读写XML格式的文档,完成数据交换、声明:大多数XML文档以XML声明作为开始、建议使用XML声明,但它不是必需的。如果有,它一定是文档的第一行内容。、注释、实体:不能直接…

技校学生计算机周记,技校学生周记

技校学生周记 导语:社会发展,科技进步,新时代的学生有了很多的变化。他们要比以往的学生要更老练,独立思考的能力也有所加强,以下是小编为大家整理的技校学生周记,欢迎大家阅读与借鉴! 技校学生…

关于原型(周记)

1.函数的prototype属性: 1)每个函数都有一个prototype属性,它默认指向一个object空对象(称作:原型对象); 2)原型有一个属性constructor,它指向函数对象; 3…

Langchain 集成 Milvus

Langchain 集成 Milvus 1. 安装 Docker2. 部署 Milvus3.4. Langchain 集成 Milvus 1. 安装 Docker refer: https://docs.docker.com/engine/install/centos/ Milvus 会以容器方式启动,所以先安装 Docker。(本示例使用的是 Alma Linux 9.2) 卸载旧版本&#xff0c…

仿微信界面开发的聊天软件和聊天客户端功能介绍

系统模式:独立系统版本,独立服务器部署,服务器配置:建议 4 核 8G;10M 带宽既可 以下是聊天系统客户端的功能介绍,服务端的功能我会再写一篇文章接着 仿微信聊天开发的聊天软件以及聊天客户端功能介绍插图 …

h5仿微信聊天(高仿版)、微信聊天表情|对话框|编辑器

之前做过一版h5微信聊天移动端,这段时间闲来无事就整理了下之前项目,又重新在原先的那版基础上升级了下,如是就有了现在的h5仿微信聊天高仿版,新增了微聊、通讯录、探索、我四个模块 左右触摸滑屏切换,聊天页面优化了多…

Android 高仿微信实时聊天 基于百度云推送

转载请标明出处:http://blog.csdn.net/lmj623565791/article/details/38799363 ,本文出自:【张鸿洋的博客】 一直在仿微信界面,今天终于有幸利用百度云推送仿一仿微信聊天了~~~ 首先特别感谢:weidi1989分享的Android之基于百度云…

LSTM笔记

RNN, LSTM, GRU模型的作用, 构建, 优劣势比较,attention机: https://blog.csdn.net/sinat_28015305/article/details/109355828?ops_request_misc%257B%2522request%255Fid%2522%253A%2522167903492816800182195114%2522%252C%2522scm%2522%253A%252220140713.130102334..%252…

手把手教你生成正式签名的APK文件

一,使用Android Studio生成 1. 2. 3.如果先前没有则先点Create new 4. 5. 6. 7.点击Finish 8. 二.使用Gradle生成: 1.在安卓闭包中加上 上图紫色字体跟第一种生成方式填的内容一样,这里我把它隐藏起来了 注:一定要放在buildTy…

Android购物软件制作(毕业设计)

本篇博客为了展示自己的实战结果,完成了对淘宝功能的实现,主要用于毕业设计的完成。 首先贴图以表效果,虽然拉跨,但是毕业够用! 首先:要开发一款淘宝类的APP,其实分为两种,一种是淘…

[干货]手把手教你写一个安卓app

摘要:最近有很多小伙伴在后台留言:Android Studio。我想大家是想写一个手机app,前面已经分享了在QT上如何写一个安卓蓝牙app,虽然qt可以做app,但是比起Android Studio还是差很多。这里介绍一种快速入门的方法来制作一款…

Android手机通讯录制作

Android手机通讯录制作 要求样图展示代码1.创建数据库2.主界面MainActivityCustomAdapter.javaactivity_main.xml 3.添加联系人AddContacts.java(添加界面)addactivity.xml 要求 设计一个基于Android的手机通讯录,此通讯录包括添加、搜索、修改、删除联系人的功能。…

安卓APP源码和设计报告——个人通讯录

摘 要 随着移动设备制造技术和移动通信网络的迅猛发展,全球手机用户日益增加,手机成为了很多人日常生活中必不可少的一部分,手机业在日益发展的同时,人们对手机的功能需求和体验需求也越来越高,因此各种智能手机相继而出,当前市场上最流行的智能手机的操作系统非An…

【视觉基础篇】12 # 如何使用滤镜函数实现美颜效果?

说明 【跟月影学可视化】学习笔记。 如何理解像素化? 像素化 所谓像素化,就是把一个图像看成是由一组像素点组合而成的。每个像素点负责描述图像上的一个点,并且带有这个点的基本绘图信息。 像素点是怎么存储的? Canvas2D 以…

C++ / Opencv 简单实现美颜效果(瘦脸、大眼、磨皮等)

最近项目需要用到美颜的一些效果,因此开始接触opencv 计算机视觉库,在腾讯课堂上找到一个简单且免费的入门视频《Opencv4 快速入门视频30讲》,看完视频后,初步才对opencv 有一个比较清晰的概念和基本用法。 接下来就是开始对美颜的一些初步接…