中文ChatGPT平替——ChatGLM:全新对话模型内测,手把手调教开源单卡版本


❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️

👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈

ChatGLM

(封面图由ERNIE-ViLG AI 作画大模型生成)

中文ChatGPT平替——ChatGLM:全新对话模型内测,手把手调教开源单卡版本

ChatGLM是一个具备问答和对话功能的语言模型,目前处于内测阶段,已经开启邀请制,并且将逐步扩大内测范围。此外,ChatGLM也已经开源了最新的中英双语对话模型ChatGLM-6B,结合模型量化技术,用户可以在消费级显卡上进行本地部署。ChatGLM-6B共经过约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术,模型参数达到了62亿。虽然规模不及千亿模型,但是ChatGLM-6B已经能够生成相当符合人类偏好的回答,大大降低了用户部署的门槛。

GLM介绍

GLM是一个用自回归填空目标预训练的通用语言模型,可以在各种自然语言理解和生成任务上进行微调。2022年11月,斯坦福大学大模型中心对全球30个主流大模型进行了全方位的评测,GLM-130B 是亚洲唯一入选的大模型。在与 OpenAI、谷歌大脑、微软、英伟达、脸书的各大模型对比中,评测报告显示 GLM-130B 在准确性和恶意性指标上与 GPT-3 175B (davinci) 接近或持平,鲁棒性和校准误差在所有千亿规模的基座大模型(作为公平对比,只对比无指令提示微调模型)中表现不错(下图)。
GLM

关于 GLM-130B 的学术文章已被国际深度学习会议 ICLR’23 接收。自2022年8月开放以来,收到53个国家369个研究机构(截至2023年2月1日)的下载使用需求,包括谷歌、微软、脸书、AI2、华为、阿里巴巴、百度、腾讯、头条、小冰、小度、小米以及斯坦福、麻省理工、伯克利、卡耐基梅隆、哈佛、剑桥、牛津、北大、浙大、上交、复旦、中科大、国科大等国内外人工智能研究机构和高校。
GLM

ChatGLM介绍

ChatGLM 参考了 ChatGPT 的设计思路,在千亿基座模型 GLM-130B1 中注入了代码预训练,通过有监督微调(Supervised Fine-Tuning)等技术实现人类意图对齐。ChatGLM 当前版本模型的能力提升主要来源于独特的千亿基座模型 GLM-130B。它是不同于 BERT、GPT-3 以及 T5 的架构,是一个包含多目标函数的自回归预训练模型。2022年8月,我们向研究界和工业界开放了拥有1300亿参数的中英双语稠密模型 GLM-130B1,该模型有一些独特的优势:

  • 双语: 同时支持中文和英文。
  • 高精度(英文): 在公开的英文自然语言榜单 LAMBADA、MMLU 和 Big-bench-lite 上优于 GPT-3 175B(API: davinci,基座模型)、OPT-175B 和 BLOOM-176B。
  • 高精度(中文): 在7个零样本 CLUE 数据集和5个零样本 FewCLUE 数据集上明显优于 ERNIE TITAN 3.0 260B 和 YUAN 1.0-245B。
  • 快速推理: 首个实现 INT4 量化的千亿模型,支持用一台 4 卡 3090 或 8 卡 2080Ti 服务器进行快速且基本无损推理。
  • 可复现性: 所有结果(超过 30 个任务)均可通过我们的开源代码和模型参数复现。
  • 跨平台: 支持在国产的海光 DCU、华为昇腾 910 和申威处理器及美国的英伟达芯片上进行训练与推理。

ChatGLM-6B 特点

ChatGLM-6B 是一个具有62亿参数的中英双语语言模型。通过使用与 ChatGLM(chatglm.cn)相同的技术,ChatGLM-6B 初具中文问答和对话功能,并支持在单张 2080Ti 上进行推理使用。具体来说,ChatGLM-6B 有如下特点:

优势:

  • 充分的中英双语预训练:ChatGLM-6B 在 1:1 比例的中英语料上训练了 1T 的 token 量,兼具双语能力。
  • 优化的模型架构和大小:吸取 GLM-130B 训练经验,修正了二维 RoPE 位置编码实现,使用传统 FFN 结构。6B(62亿)的参数大小,也使得研究者和个人开发者自己微调和部署 ChatGLM-6B 成为可能。
  • 较低的部署门槛:FP16 半精度下,ChatGLM-6B 需要至少 13 GB 的显存进行推理,结合模型量化技术,这一需求可以进一步降低到 10GB(INT8)和 6GB(INT4),使得 ChatGLM-6B 可以部署在消费级显卡上。
  • 更长的序列长度:相比 GLM-10B(序列长度 1024),ChatGLM-6B 序列长度达 2048,支持更长对话和应用。
  • 人类意图对齐训练:使用了监督微调(Supervised Fine-Tuning)、反馈自助(Feedback Bootstrap)、人类反馈强化学习(RLHF)等方式,使模型初具理解人类指令意图的能力。输出格式为 markdown,方便展示。
    劣势:
  • 相对较弱的模型记忆和语言能力。在面对许多事实性知识任务时,ChatGLM-6B 可能会生成不正确的信息,也不太擅长逻辑类问题(如数学、编程)的解答。
  • 可能会产生有害说明或有偏见的内容:ChatGLM-6B 只是一个初步与人类意图对齐的语言模型,可能会生成有害、有偏见的内容。
  • 较弱的多轮对话能力:ChatGLM-6B 的上下文理解能力还不够充分,在面对长答案生成和多轮对话的场景时,可能会出现上下文丢失和理解错误的情况。

ChatGLM-6B本地部署(在Ubuntu18.04系统中测试通过)

(1) 首先安装git

Ubuntu环境下运行以下命令下载安装git git简介及常用命令介绍

apt-get install git

(2) 然后clone官方开源的ChatGLM-6B源码

运行以下代码下载官方源码:

git clone https://github.com/THUDM/ChatGLM-6B.git

然后进入ChatGLM-6B文件夹:

cd ChatGLM-6B

(3)安装python环境

可以使用conda新建一个python环境用于运行代码:

# 新建chatglm环境
conda create -n chatglm python=3.8
# 激活chatglm环境
conda activate chatglm
# 安装PyTorch环境(根据自己的cuda版本选择合适的torch版本)
# 建议安装torch1.12版本,版本太低例如1.7.1版本我测试过会出错
pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113
# 安装gradio用于启动图形化web界面
pip install gradio
# 安装运行依赖
pip install -r requirement.txt

(4)对源文件进行一定的修改

在web_demo.py的最后一句demo.queue().launch(share=True),加两个server_name=“0.0.0.0”, server_port=1234参数,其中server_name如果是本地部署的话可以写127.0.0.1,端口可以自己定义,不要和自己电脑的一些端口冲突就行。

最后在浏览器输入http://server_name:server_port就可以开始调教了。

参考文献

[1] ChatGLM:千亿基座的对话模型启动内测,单卡版模型已全面开源 https://mp.weixin.qq.com/s/N79Sdx3K1em1EJxQZ9lcpA
[2] ChatGLM:千亿基座的对话模型开启内测
⸺对应单卡版本开源 https://chatglm.cn/blog
[3] ChatGLM-6B https://github.com/THUDM/ChatGLM-6B


❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️

👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/499.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

为什么爆火的是 ChatGPT ?OpenAI 做对了什么?

击上方关注 “终端研发部” 设为“星标”,和你一起掌握更多数据库知识 声明:本文首发于我的知乎:httpss://www.zhihu.com/question/585105560/answer/2918122037 最近最火的莫过于ChatGPT了,漂亮国很多高校学生都会用来做作业写论…

ChatGPT和New Bing的区别不同是什么?

我获得了 New Bing 的体验资格之后,迫不及待的进行了第一次使用 New Bing 的尝试。 你是谁 我是必应,一个可以帮你搜索信息和聊天的网站。😊 你是chatgpt吗 不,我不是chatgpt。我是必应,一个可以帮你搜索信息和聊天…

爆火的ChatGPT是什么?一文带你了解

前言 本文将带大家了解ChatGPT是什么 最近你是不是被它刷屏了? ChatGPT是什么?很多人第一眼看到这个英文名字可能就失去了大半的兴趣,但是,相信我,你只需要花费一点点时间去了解它,你一定会充满兴趣&#…

如何正确使用chatgpt,让chatgpt回答优质内容?

我们以chatgpt写一篇文章为例。大家都知道,如果直接让chatgpt写某篇文章,他的回答总是简洁明了的,因为它定位就是聊天,而不是会像“舔狗”一样写一篇小作文。 并且他的回答,总是固定格式的,只要稍微了解ch…

ChatGPT的基本使用方法和具体使用案例(持续更新中。。。)

普通人使用ChatGPT重在磨练基本功,我下面提供的这套基本功如果你能融会贯通,对内容生产者们有着魔法级别的帮助,至少提升10倍的生产效率。 所谓ChatGPT的基本功核心是学会设置 Prompt , Prompt 你可以理解成「提示语」&#xff0…

【ChatGPT使用笔记】 ChatGPT回答不完整,如何获取后续的内容

____tz_zs 对于 ChatGPT 回答不完整的情况(篇幅限制,没有说完),可以输入“继续”指令,让其继续回答下去,获得完整内容。 如下图,发问 “使用web3js 调用 eth链智能合约” 直到这里才是获得了刚…

你的 ChatGPT 使用姿势是错的!告诉你 4 个使用 ChatGPT 的小技巧

大部分人使用 ChatGPT 的方式都是错的,比如: 没有在提问时提供案例。忽略了可以通过设置 ChatGPT 的角色来控制它的行为。没有提供过多有效信息,而是让 ChatGPT 猜猜猜。 之所以会犯这些错误,是因为我们使用 ChatGPT 时还停留在…

干货 | ChatGPT使用指南,让你轻松上车AI世界!

Hello,大家好! 这里是壹脑云科研圈,我是喵君姐姐~ 聊天机器人(Chatbot)是一种人工智能应用,可以模拟人类对话行为,以自然语言进行交互。 在过去的几年里,随着自然语言处理技术和深…

chatGPT使用疑难问题汇总

疑难问题汇总 准备工作1: 梯孑 客户端软件 ,设置全局, 软路由不行,湾湾不行,紫荆花不行,北极熊不行,不要问为什么ipinfo.io 查看自己的IP 是否在外面,但是不要登录这个网站游览器 …

ChatGPT使用实测:是不是真的像吹的那样神乎其神?

ChatGPT越来越火,网上早已经把它吹爆。那么今天我们就一起来验证一下,ChatGPT的能力到底如何。作为一名IT从业者,第一件事就是测试它的编程能力到底如何,是否真的在未来会砸掉程序猿们的饭碗! 一、测试ChatGPT的编程能…

ChatGPT 学习与使用总结

ChatGPT 学习与使用总结 最近ChatGPT大火,2023有可能就是AGI元年了。近两个月使用下来,ChatGPT给我最深刻的感觉就是它所具备的理解和思维能力,第一次体验时真的是非常震撼,完全是之前各种『人工智障』智能助理所不能比拟的&…

ChatGPT的使用感受

ChatGPT背景: ChatGPT 是一种专注于对话生成的语言模型。它能够根据用户的文本输入,产生相应的智能回答。这个回答可以是简短的词语,也可以是长篇大论。其中GPT是Generative Pre-trained Transformer(生成型预训练变换模型&#…

ChatGPT 使用场景

官方场景 代码相关 程序语言转换,比如Python转Java。目前支持语言包括Python, Java, Go, Node.js, R, C等; 生成程序命令;(这个是我在工作中一直使用的,能极大的加快代码开发) 修复代码Bug; SQL语句生成&#xff1b…

ChatGPT 使用 拓展资料:用 Rasa Open Source 和 ChatGPT 回答有关结构化数据的问题

ChatGPT 使用 拓展资料:用 Rasa Open Source 和 ChatGPT 回答有关结构化数据的问题 几年前,我们引入了将 Rasa 与知识库集成的功能,允许助手回答详细的 问题,就像下面的对话一样。 虽然功能强大,但知识库功能的设置工作量很大。ChatGPT 回答有关结构化数据的问题的能力给…

ChatGPT使用接口和使用网页的区别

我们可以在OpenAi里看到好多接口,同样也可以在chat网页上输入聊天。区别 功能不同:GPT网页版是提供给普通用户使用的在线文本编辑器,而调用API接口则是给开发者提供的编程接口,可以在代码中调用模型进行文本生成等操作。 自由度不…

OpenAI ChatGPT 使用示例(程序员)

作为一个程序员,当知道ChatGPT出来之后或者GPT3出来的时候,我是有喜有忧,喜的是它可以帮我写代码,重构代码,写注释,写测试,,。哇,听起来好刺激,我可以从此以后…

ChatGPT使用感受

前言 本文介绍OpenAI的ChatGPT的使用教程、使用截图以及使用感受。 使用教程 教程链接:教程 使用截图 基础问题 学术问题 代码编程 使用感受 整体来看,ChatGPT对自我认知合理,词义理解非常精准,回答也很全面。可以提…

ChatGPT使用学习(三):ChatGPT桌面版使用

文章目录 介绍获取方式界面展示 介绍 ChatGPT桌面版是指OpenAI推出的针对个人用户的ChatGPT应用程序。它是一个独立的桌面应用程序,可以在本地计算机上运行,而无需依赖互联网连接。这使得用户可以在没有网络连接的情况下使用ChatGPT进行对话和获取智能回…

ChatGpt使用、小白上手指南,整理5个ChatGpt学习文库和平台

ChatGpt目前很火,话题度很高,关于它的账号售卖、视频课程网上遍地都是,尝试没有窍门,学习付费太高,一不小心就会被割韭菜。 闲暇之余也从网上搜集整理了5个平台,里面系统的介绍了有关ChatGpt的应用和相关&…

chatgpt赋能python:Python下载安装指南

Python下载安装指南 Python是一种易学易用的高级编程语言,它是很多软件工程师的首选语言。在这篇文章中,我们将介绍如何下载和安装Python,以便你可以开始使用这个强大的语言。 下载Python 首先,你需要下载Python的安装程序。请…