性能提升571%,32K超长上下文,推理速度提升42%,允许商用,国产开源大模型推出了二代 ChatGLM2-6B...

6月份是火热的夏天,各种火热的 AI 产品也在密集的更新,天越热,大家是干得热火朝天,卷出了新高度。

前有现在大火的 ChatGPT,ChatGPT 更新:大杀器!函数调用示范,ChatGPT 3.5/4 双双升级:更长,更便宜,更开放,更可控

接着有画图神器 Midjourney,制作看大片一样的推拉镜头效果,刚一个月AI绘图神器 Midjourney 又又更新了

现在有咱们中国自己的开源大模型 ChatGLM-6B 的官宣了更新内容:‍‍‍

2405ab4c411d70c6effd2c5fb2bf1bc8.png

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性:

更强大的性能:基于 ChatGLM 初代模型的开发经验,我们全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了 GLM 的混合目标函数,经过了 1.4T 中英标识符的预训练与人类偏好对齐训练,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、CEval(+33%)、GSM8K(+571%) 、BBH(+60%)等数据集上的性能取得了大幅度的提升,在同尺寸开源模型中具有较强的竞争力。

更长的上下文:基于 FlashAttention 技术,我们将基座模型的上下文长度(Context Length)由 ChatGLM-6B 的 2K 扩展到了 32K,并在对话阶段使用 8K 的上下文长度训练,允许更多轮次的对话。但当前版本的 ChatGLM2-6B 对单轮超长文档的理解能力有限,我们会在后续迭代升级中着重进行优化。

更高效的推理:基于 Multi-Query Attention 技术,ChatGLM2-6B 有更高效的推理速度和更低的显存占用:在官方的模型实现下,推理速度相比初代提升了 42%,INT4 量化下,6G 显存支持的对话长度由 1K 提升到了 8K。

更开放的协议:ChatGLM2-6B 权重对学术研究完全开放,在获得官方的书面许可后,亦允许商业使用。如果您发现我们的开源模型对您的业务有用,我们欢迎您对下一代模型 ChatGLM3 研发的捐赠。

算力是制约大模型的一个重要硬件资源,更好的性能说明可以用更少的钱办更多的事。

这次的更新,一口气扩展到了32K。ChatGPT 更新之后才从4K扩展到了16K,咱们一步到位干到32K,我觉得绝大部分场景够用了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

更高效的推理,说明人工智能思考的速度更快了。大模型本质上就是在计算一个词后面跟着另外一个词的概率,算得快,更高效的推理,代表了更快的响应速度,用户体验更好了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

这么好的大模型,完全允许我们拿过来商用,实在是良心企业,造福一方之举。‍‍‍‍‍‍‍‍‍‍‍

总之一句话:咱们的国产大模型变得又快又好又开放。

顺便贴两个网页版本和命令行版本运行的界面,方便朋友们了解。‍‍

命令行:‍

b928e53b2292944d2e8b02df19560452.png

网页版:‍‍‍

e608fb01e97a80239874ef44fc052911.gif

我准备按官方的说明手册,搭一个网页的版本,届时请朋友们试用。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

对更多细节感兴趣的朋友,可以去官网申请使用,也可以去 Github 上下载源码搭建一个自己的大模型试试。‍‍

官网地址:https://chatglm.cn/

Github:

https://github.com/THUDM/ChatGLM2-6B

(临时插播:正要发出文章之前,收到通过申请试用的短信,官方效率挺高!试用后,再给朋友们写一些介绍)‍‍‍‍‍‍


关注我,免费领取九大类别,数百篇 AI 学习资源。

一起学习 ChatGPT,掌握 AI 工具,不被时代淘汰。

关于注册 ChatGPT,体验 Midjourney,搭建 Stable Diffusion,私有知识库部署等等问题和建议都可以在公众号上联系我。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/17281.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

超级AI大脑 / springboot-openai

温馨提醒 本项目仅适用学习交流,并且不提供无偿的 维护修改服务(但可提issue)本项目不在任何平台出售,如有发现请积极举报为了更好的体验,友情提示此项目是一个全栈项目,认真刻苦的掌握它,熟练掌握后你就比…

却话文心一言(Chatgpt们),存算一体真能突破AI算力“存储墙”|“能耗墙”|“编译墙”?

文心一言折戟沉沙 作为国内搜索引擎巨头玩家,百度在中文语料领域拥有大量的积累,在算力基础设施等层面也拥有优势。 但是国产化AI芯片的处境其实很难。 这不是危言耸听,也不是崇洋媚外。这不,百度文心一言初战吃瘪。 图1. 文心一言…

GPT-4 大升级!太太太太强了!

金磊 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 万众期待的GPT-4,它来了! OpenAI老板Sam Altman直接开门见山地介绍说: 这是我们迄今为止功能最强大的模型! 有多强? 根据OpenAI官方的介绍,GPT-4是一个超大的…

GPT-4发布!ChatGPT大升级!

来源:量子位(id:QbitAI)作者:金磊 梦晨一觉醒来,万众期待的GPT-4,它来了! OpenAI老板Sam Altman直接开门见山地介绍说: 这是我们迄今为止功能最强大的模型! 有…

GPT-4:不open的OpenAI,终于不再编造事实

去年, ChatGPT 横空出世,带着独特的大型预训练模型,掀起了 GPT 和 AIGC 的浪潮,一时之间关于 OpenAI 的话题不断,各互联网大厂都纷纷入局,想要加入这场“变革”的狂欢。但在 GPT 引发无数人追捧的同时&…

美团王兴将参与王慧文光年之外A轮投资;海康机器人拟募资60亿元创业板上市;赛富时启动2.5亿美元生成式AI基金丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 苹果新专利获批,自动驾驶汽车有效路况监控范围扩大到200米 3月7日,据美国商标和专利局(USPTO)公示的清单,苹果获得了41项技术专利,其中多项…

小狐狸ChatGPT付费创作系统V2.0.8独立版 +WEB端+ H5端 + 小程序端+新增PC端绘画 安装说明

ChatGPT付费创作系统V2.0.8提供单独的升级包,升级前先更新至2.0.7版本,再上传升级包替换,同是导入升级包数据库。ChatGPT2.0.8独立版核心功能增加了PC端绘画功能,绘画功能采用其他绘画接口-意间AI,后台一些小细节的优化…

sms 短信服务说明

sms 短信服务说明 官网:https://help.aliyun.com/document_detail/57535.html 短信服务 api 短信发送流程 # 短信发送准备:短信签名、短信模板 AddSmsSign:添加短信签名,通过QuerySmsSign查看短信签名状态的审核状态 AddSmsTempla…

基于MVC+三层架构实现—SMS_登陆注册

做了一个简单的登录注册系统,基于MVC三层架构的模式,关于MVC三层架构模式的理解可以看这篇博客 https://blog.csdn.net/w_linux/article/details/79919523 下面是开发全过程 项目目录 一、创建数据库(MySQL) create database sms;use sms;create table …

harmonyos鸿蒙,鸿蒙HarmonyOS应用权限列表大全

HarmonyOS的应用权限严格按照权限分类分级模型进行定义,如图1所示,具体过程可分为三步: 1、根据不同应用所需实现的功能,明确接口是否需要对外开放。 2、根据接口所涉数据的敏感程度或所涉能力的安全威胁影响,对所有的开放接口进行分级(包括中、低、高、严重)。不对外开放…

小米网关接入Homekit完整教程

Hi 米娜桑,通过我艰苦不懈的追踪发现,绿米智能家庭产品现在也是可以部分支持Homekit啦~ 起因是我发现了这个: https://github.com/snOOrz/homebridge-aqara 然后我又跳转到了这 https://github.com/nfarina/homebridge 那么,我就…

Shot边界检测----2001-2007TRECVID比赛算法总结

概述 Shot边界检测(Shot boundary detection ,SBD)指在视频中自动检测镜头的边界,是视频分析,视频索引,视频摘要,视频搜索和其他基于内容的视频操作的基本的预处理步骤。自动SBD是2001至2007年…

IJCAI探营第一天 6个Tutorial 和13个Workshop为什么都“挤在” RMIT 80号楼?

雷锋网消息:今天是IJCAI大会(国际人工智能联合会议)的第一天,在寒冷的墨尔本,雷锋网(公众号:雷锋网)的记者来到这里为大家带来大会的最新报道。 大会的前两天在墨尔本皇家理工大学(RMIT&#xf…

每日区块链:区块链需求增加,Nvidia有望获得巨额利润;澳洲大学建立世界首家区块链社会科学研究中心

1、区块链需求增加,Nvidia有望获得巨额利润 如今,许多公司已经开始采用区块链技术。市场报告称,区块链市场规模很可能从去年的2.102亿美元增长至2021年的23.125亿美元。 尽管区块链的主要目标是银行、支付系统和金融机构,但其他公…

博士申请 | 皇家墨尔本理工大学鲍芝峰教授招收数据挖掘方向全奖博士生

合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 皇家墨尔本理工大学 皇家墨尔本理工大学(Royal Melbourne Institute of Technol…

RMIT大学“3D打印”创造美好未来-“私人订制”人体骨骼!

-患上恶性骨肿瘤,需要去掉坏骨头,找到替代品植入。但传统假体无法满足患者缺损的精细化要求,经常因为不匹配导致功能障碍。现在通过3D打印的技术将可以改变这一切。 近日,RMIT教授Milan Brandt正在与专家Peter Choong一起开发一项…

阿德莱德计算机专业本科,最新全球高校CS专业排名出炉!想学IT的不能错过这几所澳洲高校!...

近年来,如果被问到哪个专业在世界范围内都“吃香”,那么与计算机相关的专业一定是标准答案! 随着社会发展越来越发达,关于计算机类领域的发展可谓是在不断的加速。人工智能、互联网技术存在于日常生活的方方面面。与之相关的信息安…

RMIT阿里UTS中山提出Target-aware Transformer,进行one-to-all知识蒸馏!性能SOTA

关注公众号,发现CV技术之美 本文分享 CVPR 2022 Oral 的一篇论文『Knowledge Distillation via the Target-aware Transformer』,由RMIT&阿里&UTS&中山提出Target-aware Transformer,进行one-to-all知识蒸馏!性能SOTA…

悉尼大学计算机工程专业世界排名,2019QS澳洲计算机专业排名,7所大学进入世界百强!...

原标题:2019QS澳洲计算机专业排名,7所大学进入世界百强! 说起计算机专业,很多学生会联想到好就业薪水丰厚,不仅是国内,在全球来看,计算机专业人才都非常受欢迎,所以这几年出国留学就…

澳洲转专业学计算机,刚来澳洲留学,我就想转专业!(附转专业攻略)

原标题:刚来澳洲留学,我就想转专业!(附转专业攻略) 粥粥最近遇到有朋友问: 澳洲留学可以转学或者转专业不? 这个嘛~ 相信有部分小伙伴在出国留学后, 也可能会遇到过这样的问题。 有的因为感觉专业不适合自己…