ChatGLM :千亿基座的对话模型启动内测,单卡版模型已全面开源

9c658c7e5a550f8d952f06626c11facc.gif

近日,由清华技术成果转化的公司智谱 AI 开源了 GLM 系列模型的新成员——中英双语对话模型 ChatGLM-6B,支持在单张消费级显卡上进行推理使用。这是继此前开源 GLM-130B 千亿基座模型之后,智谱 AI 再次推出大模型方向的研究成果。与此同时,基于千亿基座模型的 ChatGLM 也同期推出,初具问答和对话功能,现已开启邀请制内测(内测申请网址 chatglm.cn ),后续还会逐步扩大内测范围。

开源的地址:https://github.com/THUDM/ChatGLM-6B 

14fa2394bbd911a10b94bc39303c8bd6.png

什么是 ChatGLM-6B?

据悉,ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,并针对中文进行了优化。该模型基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。

ChatGLM-6B 使用了和 ChatGLM 相同的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 虽然规模不及千亿模型,但大大降低了推理成本,提升了效率,并且已经能生成相当符合人类偏好的回答。

087388c9856af632ab8b2c42b3e8f8ba.png

ChatGLM-6B 有什么优势?

具体来说,ChatGLM-6B 具备以下特点:

  • 充分的中英双语预训练:ChatGLM-6B 在 1:1 比例的中英语料上训练了 1T 的 token 量,兼具双语能力。

  • 优化的模型架构和大小:吸取 GLM-130B 训练经验,修正了二维 RoPE 位置编码实现,使用传统 FFN 结构。6B(62亿)的参数大小,也使得研究者和个人开发者自己微调和部署 ChatGLM-6B 成为可能。

  • 较低的部署门槛:FP16 半精度下,ChatGLM-6B 需要至少 13 GB 的显存进行推理,结合模型量化技术,这一需求可以进一步降低到 10GB(INT8) 和 6GB(INT4),使得 ChatGLM-6B 可以部署在消费级显卡上。

  • 更长的序列长度:相比 GLM-10B(序列长度1024),ChatGLM-6B 序列长度达 2048,支持更长对话和应用。

  • 人类意图对齐训练:使用了监督微调 (Supervised Fine-Tuning)、反馈自助(Feedback Bootstrap)、人类反馈强化学习(Reinforcement Learning from Human Feedback)等方式,使模型初具理解人类指令意图的能力。输出格式为 markdown,方便展示。

基于以上特点,ChatGLM-6B 在一定条件下具备较好的对话与问答能力,以下是 ChatGLM-6B 的对话效果展示:

3d0fd90cdc8cf680dcbe15b751574f1d.jpeg

0f9441c0c7e4d7d9d3f3723563558be1.png

6868b34fdfb8ed768601680cc684af24.png

ChatGLM-6B 的不足

由于 ChatGLM-6B 模型的容量较小,不可避免的存在一些局限和不足,包括:

  • 相对较弱的模型记忆和语言能力。在面对许多事实性知识任务时,ChatGLM-6B 可能会生成不正确的信息,也不太擅长逻辑类问题(如数学、编程)的解答。

  • 可能会产生有害说明或有偏见的内容:ChatGLM-6B 只是一个初步与人类意图对齐的语言模型,可能会生成有害、有偏见的内容。

  • 较弱的多轮对话能力:ChatGLM-6B 的上下文理解能力还不够充分,在面对长答案生成和多轮对话的场景时,可能会出现上下文丢失和理解错误的情况。

4cc1dd51f5824e2c77b020cb78e8cb78.png

ChatGLM 线上模型内测

同时,智谱 AI 还开启了 ChatGLM 线上模型的内测。相比起 ChatGLM-6B,ChatGLM 线上模型的能力提升主要来源于独特的千亿基座模型 GLM-130B。它采用了不同于 BERT、GPT-3 以及 T5 的 GLM 架构,是一个包含多目标函数的自回归预训练模型。2022 年 11 月,斯坦福大学大模型中心对全球 30 个主流大模型进行了全方位的评测,GLM-130B 是亚洲唯一入选的大模型。在与 OpenAI、Google Brain、微软、英伟达、Meta AI 的各大模型对比中,评测报告显示 GLM-130B 在准确性和公平性指标上与 GPT-3 175B (davinci)  接近或持平,鲁棒性、校准误差和无偏性优于 GPT-3 175B (下图)。

16eaaba4cd37a6b366004e8f49006464.png

基于千亿基座的 ChatGLM 线上模型目前在 chatglm.cn 进行邀请制内测,用户需要使用邀请码进行注册,也可以填写基本信息申请内测。

由 ChatGLM 生成的对话效果展示:

85b13f3122a84b5fbda7d898e3c4492b.png

d05a2aa8452af16d56e749329cadc0e0.png

968c5480dfdab77ac9906577495e070e.png

整体而言,ChatGLM 距离国际顶尖大模型研究和产品还有一定差距,GLM 团队也在博客中坦言了这一点,并表示将持续研发并开源更新版本的 ChatGLM 和相关模型。欢迎大家下载 ChatGLM-6B,基于它进行研究和(非商用)应用开发。GLM 团队希望能和开源社区研究者和开发者一起,推动大模型研究和应用在中国的发展。

 

f6586a15d62967f7108e563704baef84.gif

☞香港科技大学:期中报告使用 ChatGPT 可加分;爆谷歌、微软已在韩国开始裁员;美国最大加密货币银行宣布关闭|极客头条
☞烧数亿美元、耗上万颗英伟达 GPU,微软揭秘构建 ChatGPT 背后超级计算机往事 !
☞各家的“ChatGPT”什么时候能取代程序员?CSDN AI编程榜发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/37837.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:Python平面图制作教程

Python平面图制作教程 Python是一种高级编程语言,也是数据科学和机器学习领域中使用最广泛的编程语言之一。在数据可视化中,Python语言具有优秀的表现力和灵活性,可以为用户展示各种数据可视化方案。这篇文章将重点介绍Python如何制作平面图…

ChatGPT 高效对话-学习使用提示语Prompts​

我们整理了一些可以帮助你学习如何使用ChatGPT的资源,包括吴恩达教授最新推出的官方ChatGPT提示词工程师课程的中文B站视频资源,一些插件、使用ChatGPT的标准范式等。 我们将这些所有的相关网址收录到 webhub123 ChatGPT 高效对话-学习使用提示语Promp…

谷歌文本转语音(gtts)批量转换

1. 测试环境2. 谷歌云平台注册3. gtts 使用 3.1. 基本介绍3.2. 准备工作3.3. 本地环境变量设置3.4. 安装python包 4. 测试 最近工作中要将文本转换成多国语音,试了下gtts,效果不错,来记录下 1. 测试环境 项目版本操作系统Ubuntu20.04python3…

AI 换脸冒充明星直播带货:仅需 3.5 万元,随意“换脸”

昨日央视财经曝光了一些直播间使用 AI 换脸技术,冒充明星进行直播带货的现象。据悉,这种 AI 换脸技术可以在几个小时内完成,只需花费 3.5 万元就可以购买一套实时换脸的模型,可以随意替换素材,AI 实时换脸,…

【干货】2023直播电商带货playbook:违禁行为及用词指南.pdf(附下载链接)

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年4月份热门报告合集 万字干货:ChatGPT的工作原理 无需翻墙,ChatGPT直接使用 2023年创业(有创业想法)必读手册 ChatGPT调…

AIGC风起,直播带货江湖剧变?

文|螳螂观察 作者| 图霖 “24小时不间断直播,你一个人怎么做到的?” 在芒果TV新推出的综艺《女子推理社》第一案里,嘉宾对拿到直播销冠的NPC提出了疑问。 后来,众人通过查找线索找到了答案:公司另找了两人整容成销…

python虚拟数字人直播间带货

本开源项目名为“数字人控制器”。意为,本项目可以充当时下流行的虚拟人、虚拟主播、数字人,等仿人形数字形象的内核部分。 ​ 使用UE、C4D、DAZ、LIVE2D等三维引擎软件开发的数字形象可以与本“数字人控制器”对接,从而实现虚拟主播、数字导…

怎么用Elai智能数字人来直播带货?

随着直播带货的火爆,越来越多的商家和品牌想要借助这一新兴的营销方式来提升销量和品牌影响力。但是,直播带货也面临着一些挑战,比如真人主播的成本高、稳定性差、风险大等。那么,有没有一种更好的解决方案呢?Elai智能…

AifbdScore智能AI曲谱乐谱播放识别SDK midi曲谱 应用开发 五线谱 六线谱 四线谱播放

【功能介绍】 会发声的曲谱 移调或改变谱号内置合成器可以在选定节拍速度下播放全部或是单一范例乐器。 访问曲谱的图形音乐信息全部演奏数据使用迭代器获取已排序的小节和音符,包含MIDI音高、毫秒计时的开始和音长、节拍速度、拍号等等,小节被正确排序…

全民K歌下载伴奏(tkm格式转化)

已《キセキ》为例 1.在全民K歌选择自己想要的伴奏,只要加载好了之后就可以找到缓存文件。 2.在手机找到缓存 3.如图,图中两个tkm格式文件一个是原版,一个是伴奏。接下来就是转换格式问题。 4.根据我经验,au不支持tkm格式&#xf…

tt作曲家简谱打谱软件_掌握作曲家的技巧和窍门

tt作曲家简谱打谱软件 Composer has revolutionized package management in PHP. It upped the reusability game and helped PHP developers all over the world generate framework agnostic, fully shareable code. But few people ever go beyond the basics, so this post…

html5 midi,源码:MIDI 文件生成音乐乐谱(Midi To Sheet Music)

MIDI 文件生成音乐乐谱 资源下载此资源下载价格为2D币,请先登录 资源文件列表 MidiToSheetMusic-master/LICENSE.txt , 18520 MidiToSheetMusic-master/Makefile , 1181 MidiToSheetMusic-master/README.md , 1129 MidiToSheetMusic-master/img/NotePair.ico , 26918 MidiToSh…

android切换原唱伴唱,切换伴奏和原声/设置KTV播放列表

三、 灵活切换伴奏和原声 当酷我音乐盒开始播放歌曲的KTV后,切换到“正在播放”窗口就可以欣赏到原版的KTV画面了,默认情况下播放的是原人原唱。如果要切换到伴奏声道,唱卡拉OK时,在播放窗口下方有一个“伴唱”按钮,点…

Guitar Pro8.0.1吉他制谱打谱软件

Guitar Pro是一款专业的吉他编曲、打谱软件,Guitar pro的特点是它几乎涵盖了所有的乐谱形式,包括四线谱、五线谱、六线谱等等,最新的Guitar Pro8.1版本还新增了简谱,我们可以在GuitarPro8.1中使用简谱进行演奏。Guitar pro支持在制…

在线乐谱协作编辑器composing.studio

什么是 composing.studio ? composing.studio 是使用 Rust、WebAssembly 和 TypeScript 构建的在线实时协作音乐编辑器,采用了 ABC 记谱法,允许任何人创建简单的音乐作品,具有即时乐谱渲染和实时音频播放。任何人都可以通过创建一…

【高效便捷】乐谱格式转换器,让你的曲谱全都在线!

如果你是一位音乐人,那么一定会遇到需要在不同终端或软件之间转换乐谱格式的情况。乐谱格式转换器作为一款桌面端软件,支持各种乐谱格式之间的互转,而且它还有以下特点: 1.超全功能:乐谱格式转换器是一款图形化界面的…

通过线路输入功能快速创建吉他谱

通过线路输入功能快速创建吉他谱 关键词:GTP;吉他软件 Guitar Pro 是一款功能强大的乐谱演奏和制作神器,它能帮助我们学习和演奏歌曲,提高弹唱技术,为我们喜欢的歌曲制作伴奏等等。它有多种方式供我们制作曲谱&#…

AI智能曲谱识别|乐谱识别识音SDK|人声数拍SDK|智能钢琴、MIDI音乐、打谱、曲谱乐谱播放识别SDK、音序器、合成器、播放器软件

智域智联科技致力于用“智能化教学 音乐软件模块”及“在线教育AiScore 平台”赋能传统音乐教育,使音乐教 育机构智能化教育转型成为可能。 AifbdScore是一个跨平台的声音识别和评 测库,运用人工智能深度学习算法采集各 种乐器不同音高的时域、频域特征训…

Overture打谱软件免费安装下载版介绍

现在市面上的打谱软件越来越多,选择哪一个成为了最头疼的问题。一千个人心中有一千个个哈姆雷特。我们只有根据自己的需求,通过多方面的比较才能选出最适合自己的那一个。 Overture (一)排版 我们打开一份MIDI格式乐谱 这是没有…

只需 1 分钟,这个网站用 AI 分离歌曲的人声、伴奏和乐器声

整理:Just 出品:AI科技大本营(ID:rgznai100) 疫情期间,在家待着闲来无事,一些技术人员就喜欢以技术的方式找点乐子,顺带赚钱最好了。 将歌曲中的人声和乐器声分离是一件让想使用音乐伴奏的人头疼…