如何使用GPT2中文闲聊对话系统,机器人对话,自动对话!

目录

目录结构:

运行环境:

首次运行:

如何训练自己的模型:

数据预处理:

训练模型:

如何确定这个--val_num数值:

​编辑​编辑最后说明:


打算做一个微博自动评论的一个模型,假象可以模拟回复粉丝,或者评论其他微博。

首先下载GPT2模型代码:

https://github.com/yangjianxin1/GPT2-chitchat 代码版权归原作者所有。

解压下载好的zip,并用pycharm打开

 目录结构:

打开README.md文件里面说明了目录结构:

 对应着左边的目录结构:

说明:data下的train.txt、train.pkl;model下的epoch40;sample是训练和预测了之后才会出现的,在下载时并没有这些文件,训练和预测下面会说。

运行环境:

 文件的原始运行环境:

 我的运行环境:

 python的版本号为:3.9.7

说明:如果配置了源文本的运行环境一定是跑的出来的,当时我因为已经早就下载好了pytorch,所以我就直接下载transformer发现能运行的出来,代码能执行就是好的。

pytorch的下载参考网上的资源,挺多的帖子。

首次运行:

下载好作者训练好了的模型:

链接:https://pan.baidu.com/s/1wu1C0izDNGp0TL0A2cAdCw 
提取码:20m7

说明:我只采用了百度网盘的下载,你们跟着就好了。没有用GoogleDrive下载

将下载好了的模型放入model文件下如图:

执行代码:

 说明: 我用的是第一条命令行, interact.py是执行的文件, --no_cuda是用cpu来跑, model_epoch40_50w是上面下载好了的模型

在终端执行以下命令:

python interact.py --no_cuda --model_path model/model_epoch40_50w

 注意:--model_path 不能对着README.md照抄,路径是会报错的,我上面的命令和原始文件的命令是有一点区别的。

原始文件是--model_path model_epoch40_50w

而我的是--model_path model/model_epoch40_50w

 执行之后的效果为:点击图片放大查看效果!!!

如何训练自己的模型:

数据预处理:

 说明:将语料放入data目录下,语料的第一行是自己说,第二行是机器人回应以此交互。中间的空白行表示一次对话结束,进行下一次的语料训练。

不同的语料训练出来的对话结果不同,区别是使用者偏向使模型想要说出自己想要的语句。

这里我提供我自己微博上爬取的语料:

链接:https://pan.baidu.com/s/1wYdH0YWJqaMukULH60LLsw 
提取码:mcqb

训练模型:

说明先将:train.txt转换成train.pkl

在终端运行:

python preprocess.py --train_path data/train.txt --save_path data/train.pkl

 运行结果:

 在data下生成了train.pkl文件

开始训练自己的模型:

在终端运行:

python train.py --epochs 40 --batch_size 8 --no_cuda --train_path data/train.pkl --pretrained_model model/model_epoch40_50w --val_num 11200

说明:--val_num 14000 这里的意思是将train.txt这个分为训练集:验证集=7:3

           --pretrained_model 是预训练模型

如何确定这个--val_num数值:

打开train.txt文件: 数据集一共有47874行,而我的这个数据集每一次对话只有两行,再加一次空白行,那么47874/3约为16000个数据,训练集:验证集 = 7:3  得出训练集为 16000*0.7 =  11200

 训练过程:


最后说明:

每一次运行完一个epoch都会保存到model下面,在预测的时候直接调用model下面最后一个epoch就行,有问题可以发评论,我看见且我看得懂的话就会,哈哈哈

对python感兴趣的同学可以加我

qq进行讨论,qq:3149452335  记得备注CSDN嗷

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/21299.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++ 奥特曼打怪兽之类的应用(系列3)

题目描述 在前面实验的基础上,根据题目要求进行修改,实现打斗过程。 怪兽分为四种类型(定义四个类): 普通型怪兽(NMonster):攻击力是等级2倍,生命是10倍,金钱经验是10倍 攻击型怪兽&…

用Python做一个奥特曼打怪兽的小游戏

话不多说,往下看吧! 引入需要的模块 from sprites import * from pygame import mixer设置页面格式(宽高等等) width,height 800,600 screen Screen() screen.setup(width,height) screen.bgcolor(black) screen.title(奥特曼…

C++ 奥特曼打怪兽之类的实现(系列2)

题目描述 在实验《类定义》的基础,改进并实现游戏中的两个类:奥特曼类和怪兽类。使得两个类更加接近实际要求。 奥特曼说明如下: 为每个属性设置get方法,注意奥特曼所有属性都需要 初始化(利用构造函数完成初始化),参…

用C语言画一个Q版奥特曼

有一天原本平静的村庄突然受到不明寄生生命体的袭击!“快逃!”“可是……” 快找出怪兽玛格尼亚的弱点,欢迎收看迪迦奥特曼的下集大雾来了。 今天分享一个用C语言画Q版奥特曼的源码~ 用到的是easyx图形库绘图功能,所以需要下载安…

2023-热门ChatGPT解析及使用方法

什么是Chat GPT?我们能用它来干什么? Chat GPT是一款基于人工智能技术的自然语言处理模型,由OpenAI团队开发。它能够通过机器学习技术从海量文本数据中学习语言知识,实现自然语言生成、对话生成和语言理解等功能,使得…

何让ChatGPT自动生成内容,作为客户服务工作人员的回答话术?

该场景对应的关键词库(13个): 产品知识、使用方法、售后服务、售后维修、支付方式、支付流程、产品购买、产品配送、客户投诉、客户建议、政策法规、使用注意事项、客服身份 提问模板: 1、客服团队一般需要回答几个方面的问题&…

2023爱分析 · 元宇宙厂商全景报告 | 爱分析报告

报告编委 黄勇 爱分析合伙人&首席分析师 文鸿伟 爱分析高级分析师 目录 1. 研究范围定义 2. 市场洞察 3. 厂商全景地图 4. 市场分析与厂商评估 5. 入选厂商列表 1. 研究范围定义 研究范围 2021年3月,十四五规划中首次提及元宇宙,指…

字节跳动 CEO 梁汝波发内部信:头条、西瓜、搜索等业务并入抖音

2021 年 11 月 2 日,字节跳动 CEO 梁汝波发布一则内部信,重磅宣布根据业务需要进行的组织结构优化和升级举措,以抖音、教育、飞书、火山引擎、朝夕光年、TikTok 六大业务板块为依托,遵循“紧密配合的业务和团队合并为业务板块&…

【报告分享】ChatGPT:AI模型框架研究.pdf(附下载链接)

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年2月份热门报告合集 【限时免费】ChatGPT4体验,无需翻墙直接用 ChatGPT团队背景研究报告 ChatGPT的发展历程、原理、技术架构及未来方向 ChatGPT使用总结&a…

ChatGPT 用redis实现分布式锁

背景 打算基于springboot、RedisTemplate,由ChatGPT来实现分布式锁,记录全过程。 基础介绍 基于RedisTemplate实现分布式锁 基于springboot及RedisTemplate实现分布式锁 在Spring Boot中,我们可以通过RedisTemplate来使用Redis的分布式锁机…

gpt人工智能写论文怎么样-chatGTP如何写论文

用gpt写论文怎么样 使用 GPT 写论文具体的操作方法因人而异,但可以提供一些建议: 充分理解论文的题目、主题和结构,并确定论文所需的内容和方向。 针对论文的不同部分,使用 GPT 模型进行自动化生成或补充,例如摘要、…

GPT-4 还没玩透,GPT-5已遭众人围剿

GPT-4 火爆全球,引发了人工智能大浪潮。OpenAI、微软、谷歌、百度都在不断释放王炸,所有人都相信,AI 的就是未来的生产力。 网友们在体验了性能炸裂的GPT-4之后,显然已经迫不及待地等着GPT-5的到来了。据报道 GPT-5 将于今年冬天…

人工智能开源系统,独立版本开发,国内服务器部署

Chatgpt是最近爆火的一个话题,可以通过人工智能,编辑生成自己想要的文案或者文章,但是由于防火墙的限制,国内无法直接访问,针对此问题我们开发出一套此功能的系统,。 源码下载:http://c.nxw.so/…

AIGPT中文版(人人都能使用的GPT工具)生活工作的好帮手。

AIGPT简介 AIGPT是一款非常强大的人工智能技术的语言处理工具软件,它具有 AI绘画 功能、AI写作、写论文、写代码、哲学探讨、创作等功能,可以说是生活和工作中的好帮手。 我们都知道使用ChatGPT是需要账号以及使用魔法的,其中的每一项对我们…

AIGPT中文版(无需魔法,直接使用)不愧是生活工作的好帮手。

AIGPT AIGPT是一款非常强大的人工智能技术的语言处理工具软件,它具有 AI绘画 功能、AI写作、写论文、写代码、哲学探讨、创作等功能,可以说是生活和工作中的好帮手。 我们都知道使用ChatGPT是需要账号以及使用魔法的,其中的每一项对我们初学…

AIGPT中文版(无需魔法,直接使用)安装使用教程

AIGPT是一款非常强大的人工智能技术的语言处理工具软件,它具有AI绘画功能、AI写作、写论文、写代码、哲学探讨、创作等功能,可以说是生活和工作中的好帮手。 我们都知道使用ChatGPT是需要账号以及使用魔法的,其中的每一项对我们初学者来说都是…

寻找新的 AI 应用程序和 ChatGPT 工具的前 5 个网站

人工智能 (AI) 改变了我们生活的方方面面,从提高生产力到彻底改变客户体验。随着人工智能的日益普及,对能够利用其潜力的可靠工具和服务的需求也在不断增长。幸运的是,有专门的平台可以作为宝贵的资源,指导…

图像分割领域的GPT-4.0,分割一切的AI算法:Segment Anything

一、图像分割领域的GPT-4.0 大家好,我是千与千寻,今天给大家介绍的AI算法可以称得上是图像分割领域的GPT-4.0,号称可以分割一切的AI图像分割算法——Segment Anything。 提到GPT-4.0模型,相信不必我多说,大家都不会陌生,最近实在是太火爆了,大家应该也都体验过ChatGPT那…

白泽AI:通过GPT镜像站有望打造令人兴奋的文字游戏体验

白泽AI是一个基于ChatGPT的镜像站,它有着巨大的潜力来通过GPT技术打造出令人兴奋的文字游戏功能。 借助GPT的强大生成能力,白泽AI可以创建一个虚拟世界,让玩家沉浸其中。这个文字游戏将提供一个广阔而自由的环境,在那里玩家可以探…

一定能看懂的:教你如何搭建自己的嘴臭AI,实现嘴臭GPT!包看包会!简单明了!

先看一下效果,我搭建了自己的GPT网页,可以指定角色,于是看到了之前new bing的效果: 首先在自己的python环境下安装依赖: pip install openai 在openai api官方查找到自己的openai api key 点击自己的头像&#xff0c…