实战:手把手教你colossal-AI复现Chatgpt的流程

        相信很多人都看了使用colossal-AI复现Chatgpt的流程的文章,但实际上看过了,不免有人发出“说得贼明白,就是自己做不出来”的感叹吧。本人公开一下实战过程,给有兴趣复现chatgpt流程的朋友一个参考。

一、环境搭建:

1.腾讯云购买P40 GPU服务器(T4 GPU 16G跑不动哦,OOM),该服务器是24G GPU,软件环境是:ubutun18.04+torch1.9

2.使用git clone下载colossalAI的源代码,使用了https://ghproxy.com进行了加速。

git clone https://ghproxy.com/https://github.com/hpcaitech/ColossalAI

 3.搭建nvidia docker运行环境。

4. 使用nvidia的镜像(如:nvcr.io/nvidia/pytorch:22.05-py3),注意:hpcaitech/colossalai:0.2.5的镜像无法使用--gpus参数。

sudo docker pull nvcr.io/nvidia/pytorch:22.05-py3

5. 进入ColosaalAI,创建gpt容器

sudo docker run --name gpt --gpus=all --ipc=host --rm -it -v $PWD:/gpt -p 6006 -p 8888 --ulimit memlock=-1 -v /etc/localtime:/etc/localtime:ro -d nvcr.io/nvidia/pytorch:22.05-py3

6.进入gpt容器

sudo docker exec -it gpt /bin/bash

7. 在容器的/gpt/applications/ChatGPT下,安装chatgpt及依赖,使用豆瓣加速源。

pip install . -i https://pypi.douban.com/simple

二、开始训练prompt data

1.进入example目录,下载prompts.csv,可以开始运行prompts的训练了。

python train_prompts.py prompts.csv --strategy naive

2.训练完成后,生成了两个模型文件,GPU占用大概9个G左右。

 三、开始训练reward model

1.在宿主服务中(非docker环境)安装git-lfs,用于管理模型中的大文件。

curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
sudo apt-get install git-lfs
git lfs install

2.进入到宿主服务器的ColossalAI\applications\ChatGPT\examples目录,下载bloom-560m.

git clone https://huggingface.co/bigscience/bloom-560m

这个时间比较长,要下载3个多G的模型文件,耐心等待。

3. 在gpt容器中训练reward model

python train_reward_model.py --pretrain bloom-560m

四、运行benckmark

 请参考ReadMe.md进行。

五、说明

        其中带dummy后缀是随机生成的prompts,含prompts的则是使用了prompts.csv,微调训练使用的是gpt2模型,reward model训练使用的是bloom模型,benckmark使用的是opt模型,目前并没有完整的串联起来,可以根据自己的理解去实现一下。即先通过prompt方法使用大模型(如:gpt2/bloom/opt)去微调出一个actor model,然后使用带人类反馈的标注数据去训练一个reward model,再使用reward model去训练actor model,得到符合人类反馈评价的model。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/29769.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:Python开发桌面应用全面介绍

Python开发桌面应用全面介绍 Python是一种非常万能的编程语言,也逐步发展成为一种适用于开发各种桌面应用程序的语言。Python开发桌面应用的优点是它可以快速开发,易于阅读和使用,同时具有很高的可扩展性和可维护性,因此越来越多…

chatgpt赋能python:Python如何保存文件到桌面

Python如何保存文件到桌面 在编程中,常常需要将程序生成的文件保存到指定的位置。当然,最常见的目标就是桌面。本文将介绍如何在Python中将文件保存到桌面,以及可能出现的错误及解决方法。 保存文件到桌面 首先,我们需要导入Py…

ChatGPT:探索无限可能的AI交互体验

在当今科技飞速发展的时代,人们对于AI智能交互体验的需求越来越高。而ChatGPT作为一款强大的语言模型,为我们提供了许多前所未有的机会去探索这样的交互体验。 ChatGPT是基于OpenAI GPT系列模型以及大量训练数据训练而成的聊天机器人,它可以…

VS Code常见问题及解决办法合集

目录 1. 终端文字显示异常2. 切换Python环境 1. 终端文字显示异常 问题终端显式如下: 原因分析: 终端显式异常的原因呢是因为VS Code中的字体设置出现了问题,VS Code支持monospace的字体(font),但是如果设…

Edge扩展插件

1. 先在Edge扩展页面打开【开发者模式】➡ 找到一个待备份的插件,复制其ID(如下图)。 2. 在下面这个路径找到上一步复制的ID。 C:\Users\你的电脑名称\AppData\Local\Microsoft\Edge\User Data\Default\Extensions3. 打开该插件ID所在的路径…

亚马逊店铺产品图片上传的基本要点

众所周知亚马逊有很多规则,其中照片是重要的环节,特别是在分类审查过程中,卖方提交的照片必须首先符合亚马逊的照片标准。 不同的分类下图片还有细节的要求。很多伙伴都在亚马逊图片审核的时候掉过坑,今天亚马逊干货共享产品照片上…

根据ASIN爬取亚马逊商品的变体和图片

1.使用AMZSscount获取的产品信息的,将这一列复制一下,构造详情页的链接到redis数据库中,进行分布式抓取。 2.打开excel,先运行这个代码。 import redis import xlwings as xw conn redis.Redis(host192.168.31.104, port6379,…

​中国移动董事长杨杰:云擎未来铸重器,算启新程绘宏图

4 月 25 日,2023 移动云大会盛大开幕。中国移动董事长杨杰在大会主论坛作题为《云擎未来铸重器 算启新程绘宏图》的主旨演讲。 中国移动董事长 杨杰 杨杰指出,随着新一代信息技术深度融入经济社会民生,数字经济日益呈现出以信息网络为关键基…

ChatGPT!我是你的破壁人;比尔·盖茨不看好Web3与元宇宙;FIFA押中4届世界杯冠军;GitHub今日热榜 | ShowMeAI资讯日报

👀日报合辑 | 🎡AI应用与工具大全 | 🔔公众号资料下载 | 🍩韩信子 🎡 『GPTZero』用 ChatGPT 写论文糊弄老师?已经不灵了~ 语言生成模型的诞生与优化,给教育和学术界带来了不少困扰。继纽约教育…

openai产品展示

产品 不知道大家刷抖音的时候是否刷到了人工智能要取代人类的一些短视频,他们所提到的主角就是一个AGI模型——chatgpt,资本对其的追求程度可以用火爆🔥来形容了吧,先给大家讲一下chatgpt吧,如果没兴趣看我扯犊子可以直…

chatgpt赋能python:如何设置Python中的长度限制

如何设置Python中的长度限制 Python是一种非常流行的编程语言,用于开发各种不同类型的应用程序。在处理字符串的过程中,Python提供了一些有用的函数,以便快速设置字符串的长度限制。在本文中,我们将介绍如何在Python中设置长度限…

中国近代发生了三大移民潮,人们为什么要选择背井离乡呢?

历史发生大规模变动时,会出现一定的移民潮,在近代发生了三大移民潮,分别是走西口、闯东关、下南洋,这三次移民潮对中国产生了巨大的影响。中国传统都有落叶归根的思想,大部分迁徙外地的人们都会寻根问祖,当…

版号解禁,网络游戏却未解冻

游戏行业曙光似乎在上周五出现。当天中宣部版权局副局长冯士新在2018中国游戏产业年会上表示,首批部分游戏已经完成审核,正在抓紧核发版号。随即,腾讯在港股市场收盘涨幅达4.51%,市值重返3万亿港元。 欢呼之余,我们不能…

医药电商政策有望松绑,市场或迎来爆发期

医药电商或再次迎来爆发期。近日,国家食药监局相关负责人来广东调研医药电商监管及发展课题时透露,此次调研内容包括开放部分处方药网上销售事项及互联网上医保消费方法,接下来将制定有关政策支持优化互联网医药销售。业内人士分析指出&#…

Oracle10G遇到Imp-00003:ORACLE error 20001 encountered错误

今天通过Imp命令导入数据,遇到如图错误: 度娘一下(Google……还没开禁),是版本不一致引起的。就是导出的exp与导入的imp版本不一致,后来想想的确是,公司服务器为Oracle11g,测试为Ora…

蓝牙_红外_Wi-Fi_WLAN_3G

蓝牙(Bluetooth),是一种无线个人局域网(Wireless PAN),1994年最初由爱立信创制。1999年5月20日,由索尼易立信、国际商业机器、英特尔、诺基亚及东芝公司等业界龙头组成的蓝牙技术联盟订定技术标准。(2001年,瑞典电信设备制造商爱立信公司的手机部门分割,与日本索尼So…

安全域的划分

安全域概述 • 网络安全域是指同一系统内有相同的安全保护需求,相互信任,并具有相同的安全访问控制和边界控制策略的子网或网络,且相同的网络安全域共享一样的安全策略。广义可理解为具有相同业务要求和安全要求的IT系统要素的集合。 网络安全…

为什么不大愿意调用国内厂商提供的API

郑昀 20100819 我平时喜欢玩Mashup,所以对国外各种开放接口都有兴趣看两眼。像Twitter的,Yahoo!的(Yahoo! Pipe、YQL),Google(Buzz、Google Reader、Chart、WebFinger等)的,即使是很…

《51单片机应用开发范例大全(第3版)》——2.1 基本器件实现端口扩展实例

本节书摘来异步社区《51单片机应用开发范例大全(第3版)》一书中的第2章,第2.1节,作者:张杰 , 宋戈 , 黄鹤松 , 员玉良,更多章节内容可以访问云栖社区“异步社区”公众号查看 2.1 基本器件实现端口扩展实例 目前,比较常…

《51单片机应用开发范例大全(第3版)》——第2章 单片机接口的扩展 2.1 基本器件实现端口扩展实例...

本节书摘来自异步社区《51单片机应用开发范例大全(第3版)》一书中的第2章,第2.1节,作者 张杰,宋戈,黄鹤松,员玉良,更多章节内容可以访问云栖社区“异步社区”公众号查看。 第2章 单片机接口的扩展 单片机输…