清华系ChatGPT发布!唐杰团队打造,专对中文优化,把握新闻动态

原文:https://baijiahao.baidu.com/s?id=1760680452362672475&wfr=spider&for=pc

就在GPT4发布的同一天,唐教授在微博宣布:

基于千亿参数大模型的对话机器人ChatGLM,现在开启邀请制内测。

据介绍,ChatGLM专门针对中文进行了优化,可以说是国人友好~

看起来,写博客提纲、创作剧本、解数学题、写代码,甚至是扮演高冷御姐,它都拿捏的死死的。

量子位有幸拿到了内测名额,将在后文进行一波实测。

与此同时,还有另一个消息宣布:

唐杰团队为了与社区一起更好地推动大模型技术的发展,同时开源了包含62亿参数的双语ChatGLM-6B模型。

它最大的特点是在普通电脑上就能进行部署,有一块2080Ti就行。

一起来看看。

能写文言文致辞,知道何恺明最新动态,但……

先看ChatGLM,它是唐杰团队大模型家族时隔半年诞生的一位新成员。

alpha内测版名称叫QAGLM(全称qa-glm-v0.7)。

浅试一下效果。

首先,我们让它说了一下它和ChatGPT的区别。

它点出了自己的研发机构,和擅长中文的特点。

那么,就让它用文言文写个致谢词叭。

咋说,虽然多了一个“余”、出现了一个莫名其妙的繁体字,但读着还可以,用的排比句增强了气势。

接着,我们把前几日硅谷暴雷的文章开头丢给它,让它起个标题。

感觉还不错,起码抓住了几个关键信息。

不幸的是,论文挑战没有通过,我们把GLM-130B的链接扔给它,让它简要概括一下主题时,它说的根本不是这篇。

跟ChatGPT胡邹参考文献的操作简直有得一拼(手动狗头)。

接下来,考考它的数学能力吧。

这道小学应用题没问题:

不过鸡兔同笼,就难倒它了,最后居然还算出了负数==

编程方面,也可以解决简单的算法题。

归纳信息能力呢?我们给了一段英文需求,不难:

结果正确:

需要注意的是,目前ChatGLM每轮对话最多只可以进行5个来回,每次最多输入1000字。

它对新信息的掌握度不错,知道推特现在的CEO是马斯克,也知道何恺明3月10日回归学界的事情,但还没发现GPT-4已经发布了。

以及,目前响应速度还是非常快的,无论什么问题,回答得对不对,基本几秒内就能给出答案。

最后,量子位也让它来了个cosplay,看看哄女朋友的本事如何:

emmm,虽然有点板正,但听完这段话“我”的气确实消了。

那么,以上就是我们的测试结果,各位觉得如何?

基于1300亿参数的基座模型打造

据官方介绍,ChatGLM参考了ChatGPT的设计思路,在千亿基座模型GLM-130B中注入了代码预训练,通过有监督微调等技术来实现人类意图对齐(就是让机器的回答符合人类价值观、人类期望)。

这个GLM-130B的来头值得说道一番。

它是由清华大学知识工程实验室(KEG)与智谱AI共同研发的一个大规模中英文预训练语言模型,参数1300亿,去年8月正式对外发布。

不同于BERT、GPT-3以及T5的架构,GLM-130B是一个包含多目标函数的自回归预训练模型。

它的优势包括:

在Stanford报告的30个世界主流大模型评测中,GLM-130B也成为了亚洲唯一入选的模型。

且获得了不错的成绩:

比如在准确性和恶意性指标上与GPT-3 175B (davinci) 接近或持平,鲁棒性和校准误差在所有千亿规模的基座大模型(作为公平对比,只对比无指令提示微调模型)中也可圈可点。

而就在CCF最近的一场会议上,有现场观众提问:ChatGPT为什么没有诞生在中国?是我们没有关注这件事吗?

嘉宾就把GLM-130B搬了出来(它也入选了ICLR’23)。

现在,GLM-130B也终于被派上了“大用场”。

关于内测,唐杰团队表示,后续会逐步扩大范围,有兴趣的朋友可以再等一等。

60亿参数的缩小版同时开源

除了这个聊天机器人ChatGLM,唐杰团队这次也把GLM-130B的“缩小版”ChatGLM-6B开源了出来。

ChatGLM-6B使用与ChatGLM相同的技术,初具中文问答和对话功能。

特点如下:

当然,缺点就是容量只有60亿,其模型记忆和语言能力较弱,不擅长逻辑类问题(如数学、编程),以及多轮对话可能会出现上下文丢失和理解错误的情况。

但它主打的就是一个低门槛,在单张2080Ti上就能进行推理使用,硬件需求不高。

因此,只要有兴趣都可以下载下来试试,进行研究和(非商用的)应用开发都可以。

传送门:https://chatglm.cn/https://github.com/THUDM/ChatGLM-6B

参考链接:[1]https://weibo.com/2126427211/MxlsQ6w4A#repost[2]https://chatglm.cn/blog?continueFlag=d70d7590143c950d12ac7283214d879d

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/40194.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开箱即用的ChatGPT替代模型,还可训练自己数据(转)

开箱即用的ChatGPT替代模型,还可训练自己数据 川川菜鸟 于 2023-04-23 12:02:42 发布 2063 收藏 43 分类专栏: ChatGPT 文章标签: chatgpt 人工智能 原力计划 版权 ChatGPT 专栏收录该内容 7 篇文章7 订阅 订阅专栏 一、普遍关注是什么&…

MySQL 索引 - 学习/实践

1.应用场景 主要学习索引结构,这里主要是你指Mysql索引,然后根据具体的业务场景,选择或创建合适的索引,期望达到优化数据库查询速,或者平衡查询速度与储存容量,从而开发出满足业务需求的服务。 2.介绍[多…

AIGC时代,前端低代码平台的实践与挑战 | 6月15日TF109报名

本期技术前线邀请到阿里巴巴高级前端工程师吉婉颖(翊奕)、网易杭州研究院编程语言实验室负责人张炜昕、腾讯PCG智能创作与内容平台技术专家揭光发3位专家,围绕前端低代码平台,一起分享他们的前端技术工作经历以及如何运用到具体业…

会议交流 | 大语言模型时代的知识工程(TF97)

转载公众号 | 中国计算机学会 本期会议邀请到来自360等头部企业的技术资深人士,以及来自海乂知等知识图谱创业企业的技术负责人和来自复旦大学、东南大学等高校的顶尖学者,一起深入探讨知识工程在大语言模型时代所面临的机遇和挑战,并进一步了…

​GPT-4 发布:在考试中击败 90% 的人类;谷歌开放大语言模型 PaLM API;FireFox 111 发布|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

网络安全从业人员会被AI智能取代吗?

随着ChatGPT的火爆,很多人开始担心网络安全从业人员会被AI取代。如果说网络安全挖洞的话,AI可能真的能取代。但是网络安全不仅仅只是挖洞,所以AI只是能缓解网络安全人员不足的情况,但是是不会取代人类的作用的。 就拿最近很火的C…

网络安全从业人员2023年后真的没有活路了吗?会被AI取代吗?

​AI能缓解网络安全人员不足的情况,但是是不会取代人类的作用的。 就拿最近很火的ChatGPT来说,确实能进行恶意攻击,但是前提也是在人类的干预下。 黑莓公司曾经发布过一篇研究报告表明由人工智能驱动的ChatGPT机器人可能会对网络安全产生威…

Android版ChatGPT将于本周发;C-Eval中文大模型排名公布;我国发布首份汽车标准必要专利研究报告丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 理想汽车郎咸朋:截至7月20日,NOA辅助驾驶使用里程已突破2亿公里 7月24日消息,据悉,理想汽车自动驾驶负责人郎咸朋在其个人朋友圈发文,截至2023年7月20…

让GPT-4推理提升17倍的技巧!普林斯顿清华姚班校友提出全新「思维树ToT」框架,让LLM反复思考

夕小瑶科技说 分享 来源 | 新智元 由普林斯顿和谷歌DeepMind联合提出的全新「思维树」框架,让GPT-4可以自己提案、评估和决策,推理能力最高可提升1750%。 2022年,前谷歌大脑华人科学家Jason Wei在一篇思维链的开山之作中首次提出&#xff0c…

AI 工具合辑盘点(七)持续更新 之 AI 音频生成工具

AI 音频生成工具 想要不亲自录制,快速将文本转换为语音?AI 音频生成工具为你提供数千种语音选择,从“普通人”的声音到模仿演员、政治家或电影角色的合成声音,各种声音应有尽有 🗣 AI 音频生成工具可用于创建商业用途…

劳特巴赫trace32安装和使用

目录 劳特巴赫trace32安装 劳特巴赫使用 trace32调试 劳特巴赫trace32安装 安装说明:安装时需要连接上劳特巴赫调试器 默认步骤 劳特巴赫使用 打开你使用的内核调试器USB 1. SystemSetting可找到单片机型号 ,点击 CPU --> SystemSetting&#xff…

SMT工厂及PCB工程师的福音!可视化BOM交互焊接工具来了

目前电子产品已经渗透到我们生活的各个角落,其产品涵盖通信、医疗、计算机及周边视听产品、玩具、家用电器、军工用品等。关于电子产品的PCBA焊接,在试样阶段一般采用手工焊接。手工焊接的好处是成本低,一把电络铁就搞定了,如果样…

车牌识别--铆钉的去除

车牌识别中,每一步的效果直接影响整体的识别率,对车牌识别产生干扰的,不仅是车牌的污渍,还有铆钉。 一 、举例说明,铆钉干扰使得车牌识别错误 1、车辆图片 2、通过颜色HSV确认车牌大致位置 3、截取车牌图像 4、二值化…

ChatGPT最强竞品Claude-2重磅升级!知识更新到23年,代码数学显著提升,免费可用

夕小瑶科技说 分享 来源 | 机器之心 此次,Claude 2 除了一大波能力上的升级,更重要的是大家都可以用了。 今日,那个被很多网友称为「ChatGPT 最强竞品」的人工智能系统 Claude 迎来了版本大更新。 Claude 2 正式发布! 据介绍&a…

第09课:《ChatGPT提示工程》—— Introduction(引言)

ChatGPT 上线至今,在实际应用中,不少人还没真正掌握它的使用技巧。ChatGPT 的难点,在于 Prompt(提示词)的编写,OpenAI 创始人在今年 2 月时,在 Twitter 上说:「能够出色编写 Prompt …

视觉合集5~2022

发一个合集 总结一些2022年的 一些论文 视觉 Transformer(ViT)学习什么? 论文链接:https://arxiv.org/pdf/2212.06727.pdf 关于视觉的探索显示,ViT 学习的归纳偏置或特征与卷积神经网络(CNN)学…

2022年最值得关注的十篇论文,你都看了吗?来卷来学习

2023 点击蓝字 关注我们 关注并星标 从此不迷路 计算机视觉研究院 计算机视觉研究院专栏 作者:Edison_G 年关将至,威斯康星大学助理教授 Sebastian Raschka 盘点了 2022 年他最看好的十大论文。 公众号ID|ComputerVisionGzq 学习群&#xff5…

2022年盘点:最值得关注的十篇机器学习论文

来源:机器之心 计算机视觉与机器学习 本文约4000字,建议阅读8分钟 威斯康星大学助理教授 Sebastian Raschka 盘点了 2022 年他最看好的十大论文。 2022 年 1 月,扩散模型第一次吸引了我的眼球。当时我判断到将会有某些大事发生,然…

pycharm 黄色(黄字)高亮警告 Default argument value is mutable 原因及解决办法(mutable 可变对象与 immutable不可变对象)

示例 解决方案 按照参考文章的意思,classesread_class_names(cfg.YOLO.CLASSES)在函数调用时就会创建对象并赋初始值,如果在函数中修改了classes的值,则函数在下一次调用时,就会不会重新初始化值,而以上一…