清华系ChatGPT发布!唐杰团队打造,专对中文优化,还能把握最新新闻动态

终于,清华大学唐杰团队也出手了。

就在GPT4发布的同一天,唐教授在微博宣布:

基于千亿参数大模型的对话机器人ChatGLM,现在开启邀请制内测。

据介绍,ChatGLM专门针对中文进行了优化,可以说是国人友好~

看起来,写博客提纲、创作剧本、解数学题、写代码,甚至是扮演高冷御姐,它都拿捏的死死的:

△ 写介绍ChatGLM的博客提纲

△ Cosplay聊天扮演高冷御姐

量子位有幸拿到了内测名额,将在后文进行一波实测。

与此同时,还有另一个消息宣布:

唐杰团队为了与社区一起更好地推动大模型技术的发展,同时开源了包含62亿参数的双语ChatGLM-6B模型。

它最大的特点是在普通电脑上就能进行部署,有一块2080Ti就行。

一起来看看。

能写文言文致辞,知道何恺明最新动态,但……

先看ChatGLM,它是唐杰团队大模型家族时隔半年诞生的一位新成员。

alpha内测版名称叫QAGLM(全称qa-glm-v0.7)。

浅试一下效果。

首先,我们让它说了一下它和ChatGPT的区别。

它点出了自己的研发机构,和擅长中文的特点。

那么,就让它用文言文写个致谢词叭。

咋说,虽然多了一个“余”、出现了一个莫名其妙的繁体字,但读着还可以,用的排比句增强了气势。

接着,我们把前几日硅谷暴雷的文章开头丢给它,让它起个标题。

感觉还不错,起码抓住了几个关键信息。

不幸的是,论文挑战没有通过,我们把GLM-130B的链接扔给它,让它简要概括一下主题时,它说的根本不是这篇。

跟ChatGPT胡邹参考文献的操作简直有得一拼(手动狗头)。

接下来,考考它的数学能力吧。

这道小学应用题没问题:

不过鸡兔同笼,就难倒它了,最后居然还算出了负数==

编程方面,也可以解决简单的算法题。

归纳信息能力呢?我们给了一段英文需求,不难:

结果正确:

需要注意的是,目前ChatGLM每轮对话最多只可以进行5个来回,每次最多输入1000字。

它对新信息的掌握度不错,知道推特现在的CEO是马斯克,也知道何恺明3月10日回归学界的事情,但还没发现GPT-4已经发布了

以及,目前响应速度还是非常快的,无论什么问题,回答得对不对,基本几秒内就能给出答案。

最后,量子位也让它来了个cosplay,看看哄女朋友的本事如何:

emmm,虽然有点板正,但听完这段话“我”的气确实消了。

那么,以上就是我们的测试结果,各位觉得如何?

基于1300亿参数的基座模型打造

据官方介绍,ChatGLM参考了ChatGPT的设计思路,在千亿基座模型GLM-130B中注入了代码预训练,通过有监督微调等技术来实现人类意图对齐(就是让机器的回答符合人类价值观、人类期望)。

这个GLM-130B的来头值得说道一番。

它是由清华大学知识工程实验室(KEG)与智谱AI共同研发的一个大规模中英文预训练语言模型,参数1300亿,去年8月正式对外发布。

不同于BERT、GPT-3以及T5的架构,GLM-130B是一个包含多目标函数的自回归预训练模型。

它的优势包括:

在Stanford报告的30个世界主流大模型评测中,GLM-130B也成为了亚洲唯一入选的模型。

且获得了不错的成绩:

比如在准确性和恶意性指标上与GPT-3 175B (davinci) 接近或持平,鲁棒性和校准误差在所有千亿规模的基座大模型(作为公平对比,只对比无指令提示微调模型)中也可圈可点。

而就在CCF最近的一场会议上,有现场观众提问:ChatGPT为什么没有诞生在中国?是我们没有关注这件事吗?

嘉宾就把GLM-130B搬了出来(它也入选了ICLR’23)。

现在,GLM-130B也终于被派上了“大用场”。

关于内测,唐杰团队表示,后续会逐步扩大范围,有兴趣的朋友可以再等一等。

60亿参数的缩小版同时开源

除了这个聊天机器人ChatGLM,唐杰团队这次也把GLM-130B的“缩小版”ChatGLM-6B开源了出来。

△ GitHub已经揽获近2k标星

ChatGLM-6B使用与ChatGLM相同的技术,初具中文问答和对话功能。

特点如下:

当然,缺点就是容量只有60亿,其模型记忆和语言能力较弱,不擅长逻辑类问题(如数学、编程),以及多轮对话可能会出现上下文丢失和理解错误的情况。

但它主打的就是一个低门槛,在单张2080Ti上就能进行推理使用,硬件需求不高。

因此,只要有兴趣都可以下载下来试试,进行研究和(非商用的)应用开发都可以。

传送门:
https://chatglm.cn/
https://github.com/THUDM/ChatGLM-6B

参考链接:
[1]https://weibo.com/2126427211/MxlsQ6w4A#repost
[2]https://chatglm.cn/blog?continueFlag=d70d7590143c950d12ac7283214d879d

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/1725.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

五分钟进步系列之chatGpt最近发布的API

学习方式: 先读英文的原版,如果你能看懂就可以到此为止的了。如果你看不懂,可以再看一下我给的较高难度的英文单词的翻译。如果还是看不懂可以去最下面看我翻译的汉语。 下面是我在官网中找到的一段话。 一、英文原版 Introduction to the Ch…

ChatGPT发布iOS版App!国产已在路上!

👇👇关注后回复 “进群” ,拉你进程序员交流群👇👇 作者丨徐杰承、云昭 来源丨51CTO技术栈 https://mp.weixin.qq.com/s/WEJen_1qsqCFFOn4Df6RBA 一切能在移动端实现的,都将会在移动端实现。就连ChatGPT也…

重磅官宣:阿里版 ChatGPT 突然发布!

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 平地一声雷!今天中午阿里版类 ChatGPT 「通义千问」突然官宣: 没错,就这 3 行简短介绍 1 个官网地址,再无其他“剧透”。 好在,CSDN 有幸拿…

ChatGPT 发布重磅更新,插件系统即将上线!

这是「进击的Coder」的第 831 篇技术分享 作者:小 G 来源:GitHubDaily “ 阅读本文大概需要 4 分钟。 ” 前天凌晨,ChatGPT 为诸多 Plus 会员陆续开放了插件系统内测权限,申请比较早的用户,现在应该都能体验上最新的插…

清华大学版 ChatGPT 发布,ChatGLM启动内测!

点击“开发者技术前线”,选择“星标” 让一部分开发者看到未 转载自:机器之心 我们问了 ChatGLM 几个关键问题,它给的回答似乎很不错。 ChatGPT 的发布,搅动了整个 AI 领域,各大科技公司、创业公司以及高校团队都在跟进…

ChatGPT-4震撼发布

3月15日消息,美国当地时间周二,人工智能研究公司OpenAI发布了其下一代大型语言模型GPT-4,这是其支持ChatGPT和新必应等应用程序的最新AI大型语言模型。该公司表示,该模型在许多专业测试中的表现超出了“人类水平”。GPT-4, 相较于…

ChatGPT API使用介绍

1.概述 随着人工智能技术的不断发展,越来越多的AI产品被应用到各个领域,其中最具代表性的莫过于人工智能语言模型。语言模型是一种可以通过学习大量语言数据来预测文本或语音的技术,其应用范围十分广泛,如智能客服、机器翻译、语…

ChatGPT详细介绍原理

ChatGPT的介绍 ChatGPT全称为“chat Generative Pre-trained Transformer”,翻译成中文就是生成型预训练变换模型。它是美国公司OpenAl在2022年11月30日发布研发的聊天机器人程序,能用于问答、文本摘要生成、机器翻译、分类、代码生成和对话Al。「l是一…

ChatGPT发展机遇和思考

去年12月ChatGPT横空出世,在业界引起惊涛骇浪,最近又发布了GPT-4的进化版本,ChatGPT将对我们的工作生活有什么样的影响,又将如何应对?本文不讨论ChatGPT背后的具体模型算法和实现逻辑,只简单讨论ChatGPT对产…

ChatGPT这么火,强大的背后是什么,未来又会发展成什么样?

近日,现有的ChatGPT这么火🔥,不知道大家期不期待后续版本,这个ChatGPT3和ChatGPT4已经很久了,但是总听别人说怎么怎么好,怎么怎么牛,真的不如自己去试一把。如果还没有切身体会,是真…

未来已来,快速了解即将颠覆世界的ChatGPT

写这么一篇长文,可能有悖于“简单科普”的初衷,但是当发现这种简单科普的能力可以轻而易举的被AI所掌握的时候,输出一些主观的个人观点,无论对错,或许来的更加有意义,以激起更多的水花。 一晃眼整个冬天就过…

未来已来,时代颠覆者ChatGPT你真的了解吗?

文章目录 什么是ChatGPTchatgpt与自然语言处理从gpt1.0到chatgpt,经历了什么chatgpt是一个语言模型chatgpt是如何处理文字输入的写在最后 ✍创作者:全栈弄潮儿 🏡 个人主页: 全栈弄潮儿的个人主页 🏙️ 个人社区&#…

ChatGPT探索系列之六:思考ChatGPT的未来发展趋势和挑战

文章目录 前言一、未来发展趋势1. ChatGPT重塑数据分析之道2. ChatGPT颠覆企业运用人工智能和机器学习的途径3. ChatGPT颠覆自动化商业流程4. ChatGPT引领企业决策迈向新纪元 二、ChatGPT掀开未来充满机遇和挑战的新篇章总结 前言 ChatGPT发展到目前,其实网上已经有…

ChatGPT 与未来软件开发的关系

在过去几年中,自然语言处理 (NLP) 取得了重大进展,并为软件开发开辟了新的可能性。最令人印象深刻的 NLP 应用之一是聊天机器人的开发,它能够通过自然语言与用户交流。ChatGPT 就是这样一种聊天机器人,这是一种由 OpenAI 开发的大…

ChatGPT的影响力和未来发展

ChatGPT是一种基于深度学习的自然语言处理技术,它是由OpenAI开发的一种语言模型。ChatGPT作为一个大型语言模型,可以在很多方面对程序职业产生影响。值得注意的是,ChatGPT和其他语言模型一样,只是一种技术工具,它的应用…

ChatGPT与这一代互联网人的未来

文|黄有璨 来源|黄有璨(ID:owen_hyc) 封面来源|视觉中国 在过去几周里,ChatGPT已然成为了整个科技、互联网、投资界里被关注讨论得最多的存在,说它是2023年截止到目前为止最值得关注讨论的技…

ChatGPT未来将是什么样子?《你好,ChatGPT》深度阐述

前言 人工智能技术的发展已经逐渐改变了我们的生活和工作方式,其中,语言模型技术是近年来关注度很高的一个领域。在这个领域,ChatGPT是一个备受瞩目的产品,它不仅是一个聊天程序,更是一个能够产生具有连贯性和逻辑性的…

ChatGPT是未来吗?

ChatGPT自2022年11月份发布以来,获得了很多关注,最近GPT-4、文心一言陆续发布,也让大家有了更多的感受。这次再重新审视一下ChatGPT,谈谈未来到底是怎样的。 先拿出来ChatGPT官网对自己的一些说明: ChatGPT面临的主要…

从一路高歌到遭多国“封杀”,ChatGPT未来将是什么样子?

“IT有得聊”是机械工业出版社旗下IT专业资讯和服务平台,致力于帮助读者在广义的IT领域里,掌握更专业、更实用的知识与技能,快速提升职场竞争力。 点击蓝色微信名可快速关注我们! 人工智能技术的发展已经逐渐改变了我们的生活和工作方式&…

ChatGPT体验小记

只截取了部分内容的例子,到底ChatGPT效果怎样,不一而足。