清华系ChatGPT发布！唐杰团队打造，专对中文优化，把握新闻动态

清华系ChatGPT发布！唐杰团队打造，专对中文优化，把握新闻动态

news/2024/11/23 12:44:02/文章来源:https://blog.csdn.net/javastart/article/details/130640553

原文：https://baijiahao.baidu.com/s?id=1760680452362672475&wfr=spider&for=pc

就在GPT4发布的同一天，唐教授在微博宣布：

基于千亿参数大模型的对话机器人ChatGLM，现在开启邀请制内测。

据介绍，ChatGLM专门针对中文进行了优化，可以说是国人友好～

看起来，写博客提纲、创作剧本、解数学题、写代码，甚至是扮演高冷御姐，它都拿捏的死死的。

量子位有幸拿到了内测名额，将在后文进行一波实测。

与此同时，还有另一个消息宣布：

唐杰团队为了与社区一起更好地推动大模型技术的发展，同时开源了包含62亿参数的双语ChatGLM-6B模型。

它最大的特点是在普通电脑上就能进行部署，有一块2080Ti就行。

一起来看看。

能写文言文致辞，知道何恺明最新动态，但……

先看ChatGLM，它是唐杰团队大模型家族时隔半年诞生的一位新成员。

alpha内测版名称叫QAGLM（全称qa-glm-v0.7）。

浅试一下效果。

首先，我们让它说了一下它和ChatGPT的区别。

它点出了自己的研发机构，和擅长中文的特点。

那么，就让它用文言文写个致谢词叭。

咋说，虽然多了一个“余”、出现了一个莫名其妙的繁体字，但读着还可以，用的排比句增强了气势。

接着，我们把前几日硅谷暴雷的文章开头丢给它，让它起个标题。

感觉还不错，起码抓住了几个关键信息。

不幸的是，论文挑战没有通过，我们把GLM-130B的链接扔给它，让它简要概括一下主题时，它说的根本不是这篇。

跟ChatGPT胡邹参考文献的操作简直有得一拼（手动狗头）。

接下来，考考它的数学能力吧。

这道小学应用题没问题：

不过鸡兔同笼，就难倒它了，最后居然还算出了负数==

编程方面，也可以解决简单的算法题。

归纳信息能力呢？我们给了一段英文需求，不难：

结果正确：

需要注意的是，目前ChatGLM每轮对话最多只可以进行5个来回，每次最多输入1000字。

它对新信息的掌握度不错，知道推特现在的CEO是马斯克，也知道何恺明3月10日回归学界的事情，但还没发现GPT-4已经发布了。

以及，目前响应速度还是非常快的，无论什么问题，回答得对不对，基本几秒内就能给出答案。

最后，量子位也让它来了个cosplay，看看哄女朋友的本事如何：

emmm，虽然有点板正，但听完这段话“我”的气确实消了。

那么，以上就是我们的测试结果，各位觉得如何？

基于1300亿参数的基座模型打造

据官方介绍，ChatGLM参考了ChatGPT的设计思路，在千亿基座模型GLM-130B中注入了代码预训练，通过有监督微调等技术来实现人类意图对齐（就是让机器的回答符合人类价值观、人类期望）。

这个GLM-130B的来头值得说道一番。

它是由清华大学知识工程实验室(KEG)与智谱AI共同研发的一个大规模中英文预训练语言模型，参数1300亿，去年8月正式对外发布。

不同于BERT、GPT-3以及T5的架构，GLM-130B是一个包含多目标函数的自回归预训练模型。

它的优势包括：

在Stanford报告的30个世界主流大模型评测中，GLM-130B也成为了亚洲唯一入选的模型。

且获得了不错的成绩：

比如在准确性和恶意性指标上与GPT-3 175B (davinci) 接近或持平，鲁棒性和校准误差在所有千亿规模的基座大模型（作为公平对比，只对比无指令提示微调模型）中也可圈可点。

而就在CCF最近的一场会议上，有现场观众提问：ChatGPT为什么没有诞生在中国？是我们没有关注这件事吗？

嘉宾就把GLM-130B搬了出来（它也入选了ICLR’23）。

现在，GLM-130B也终于被派上了“大用场”。

关于内测，唐杰团队表示，后续会逐步扩大范围，有兴趣的朋友可以再等一等。

60亿参数的缩小版同时开源

除了这个聊天机器人ChatGLM，唐杰团队这次也把GLM-130B的“缩小版”ChatGLM-6B开源了出来。

ChatGLM-6B使用与ChatGLM相同的技术，初具中文问答和对话功能。

特点如下：

当然，缺点就是容量只有60亿，其模型记忆和语言能力较弱，不擅长逻辑类问题（如数学、编程），以及多轮对话可能会出现上下文丢失和理解错误的情况。

但它主打的就是一个低门槛，在单张2080Ti上就能进行推理使用，硬件需求不高。

因此，只要有兴趣都可以下载下来试试，进行研究和（非商用的）应用开发都可以。

传送门：https://chatglm.cn/https://github.com/THUDM/ChatGLM-6B

参考链接：[1]https://weibo.com/2126427211/MxlsQ6w4A#repost[2]https://chatglm.cn/blog?continueFlag=d70d7590143c950d12ac7283214d879d

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/40194.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

开箱即用的ChatGPT替代模型，还可训练自己数据（转）

开箱即用的ChatGPT替代模型，还可训练自己数据（转）

开箱即用的ChatGPT替代模型，还可训练自己数据川川菜鸟于 2023-04-23 12:02:42 发布 2063 收藏 43 分类专栏： ChatGPT 文章标签： chatgpt 人工智能原力计划版权 ChatGPT 专栏收录该内容 7 篇文章7 订阅订阅专栏一、普遍关注是什么&…

阅读更多...

MySQL 索引 - 学习/实践

MySQL 索引 - 学习/实践

1.应用场景主要学习索引结构，这里主要是你指Mysql索引，然后根据具体的业务场景，选择或创建合适的索引，期望达到优化数据库查询速，或者平衡查询速度与储存容量，从而开发出满足业务需求的服务。 2.介绍[多…

阅读更多...

AIGC时代，前端低代码平台的实践与挑战 | 6月15日TF109报名

AIGC时代，前端低代码平台的实践与挑战 | 6月15日TF109报名

本期技术前线邀请到阿里巴巴高级前端工程师吉婉颖（翊奕）、网易杭州研究院编程语言实验室负责人张炜昕、腾讯PCG智能创作与内容平台技术专家揭光发3位专家，围绕前端低代码平台，一起分享他们的前端技术工作经历以及如何运用到具体业…

阅读更多...

会议交流 | 大语言模型时代的知识工程（TF97）

会议交流 | 大语言模型时代的知识工程（TF97）

转载公众号 | 中国计算机学会本期会议邀请到来自360等头部企业的技术资深人士，以及来自海乂知等知识图谱创业企业的技术负责人和来自复旦大学、东南大学等高校的顶尖学者，一起深入探讨知识工程在大语言模型时代所面临的机遇和挑战，并进一步了…

阅读更多...

GPT-4 发布：在考试中击败 90% 的人类；谷歌开放大语言模型 PaLM API；FireFox 111 发布|极客头条...

GPT-4 发布：在考试中击败 90% 的人类；谷歌开放大语言模型 PaLM API；FireFox 111 发布|极客头条...

「极客头条」—— 技术人员的新闻圈！ CSDN 的读者朋友们早上好哇，「极客头条」来啦，快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理 | 梦依丹出品 | CSDN（ID：CSDNnews） 一分钟速览新闻点&#…

阅读更多...

网络安全从业人员会被AI智能取代吗？

网络安全从业人员会被AI智能取代吗？

随着ChatGPT的火爆，很多人开始担心网络安全从业人员会被AI取代。如果说网络安全挖洞的话，AI可能真的能取代。但是网络安全不仅仅只是挖洞，所以AI只是能缓解网络安全人员不足的情况，但是是不会取代人类的作用的。就拿最近很火的C…

阅读更多...

网络安全从业人员2023年后真的没有活路了吗？会被AI取代吗?

网络安全从业人员2023年后真的没有活路了吗？会被AI取代吗?

AI能缓解网络安全人员不足的情况，但是是不会取代人类的作用的。就拿最近很火的ChatGPT来说，确实能进行恶意攻击，但是前提也是在人类的干预下。黑莓公司曾经发布过一篇研究报告表明由人工智能驱动的ChatGPT机器人可能会对网络安全产生威…

阅读更多...

Android版ChatGPT将于本周发；C-Eval中文大模型排名公布；我国发布首份汽车标准必要专利研究报告丨每日大事件...

Android版ChatGPT将于本周发；C-Eval中文大模型排名公布；我国发布首份汽车标准必要专利研究报告丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智改变商业企业动态理想汽车郎咸朋：截至7月20日，NOA辅助驾驶使用里程已突破2亿公里 7月24日消息，据悉，理想汽车自动驾驶负责人郎咸朋在其个人朋友圈发文，截至2023年7月20…

阅读更多...

让GPT-4推理提升17倍的技巧！普林斯顿清华姚班校友提出全新「思维树ToT」框架，让LLM反复思考

让GPT-4推理提升17倍的技巧！普林斯顿清华姚班校友提出全新「思维树ToT」框架，让LLM反复思考

夕小瑶科技说分享来源 | 新智元由普林斯顿和谷歌DeepMind联合提出的全新「思维树」框架，让GPT-4可以自己提案、评估和决策，推理能力最高可提升1750%。 2022年，前谷歌大脑华人科学家Jason Wei在一篇思维链的开山之作中首次提出&#xff0c…

阅读更多...

AI 工具合辑盘点（七）持续更新之 AI 音频生成工具

AI 工具合辑盘点（七）持续更新之 AI 音频生成工具

AI 音频生成工具想要不亲自录制，快速将文本转换为语音？AI 音频生成工具为你提供数千种语音选择，从“普通人”的声音到模仿演员、政治家或电影角色的合成声音，各种声音应有尽有 🗣 AI 音频生成工具可用于创建商业用途…

阅读更多...

劳特巴赫trace32安装和使用

劳特巴赫trace32安装和使用

目录劳特巴赫trace32安装劳特巴赫使用 trace32调试劳特巴赫trace32安装安装说明：安装时需要连接上劳特巴赫调试器默认步骤劳特巴赫使用打开你使用的内核调试器USB 1. SystemSetting可找到单片机型号 ，点击 CPU --> SystemSetting&#xff…

阅读更多...

SMT工厂及PCB工程师的福音！可视化BOM交互焊接工具来了

SMT工厂及PCB工程师的福音！可视化BOM交互焊接工具来了

目前电子产品已经渗透到我们生活的各个角落，其产品涵盖通信、医疗、计算机及周边视听产品、玩具、家用电器、军工用品等。关于电子产品的PCBA焊接，在试样阶段一般采用手工焊接。手工焊接的好处是成本低，一把电络铁就搞定了，如果样…

阅读更多...

车牌识别--铆钉的去除

车牌识别--铆钉的去除

车牌识别中，每一步的效果直接影响整体的识别率，对车牌识别产生干扰的，不仅是车牌的污渍，还有铆钉。一、举例说明，铆钉干扰使得车牌识别错误 1、车辆图片 2、通过颜色HSV确认车牌大致位置 3、截取车牌图像 4、二值化…

阅读更多...

ChatGPT最强竞品Claude-2重磅升级！知识更新到23年，代码数学显著提升，免费可用

ChatGPT最强竞品Claude-2重磅升级！知识更新到23年，代码数学显著提升，免费可用

夕小瑶科技说分享来源 | 机器之心此次，Claude 2 除了一大波能力上的升级，更重要的是大家都可以用了。今日，那个被很多网友称为「ChatGPT 最强竞品」的人工智能系统 Claude 迎来了版本大更新。 Claude 2 正式发布！ 据介绍&a…

阅读更多...

第09课：《ChatGPT提示工程》—— Introduction（引言）

第09课：《ChatGPT提示工程》—— Introduction（引言）

ChatGPT 上线至今，在实际应用中，不少人还没真正掌握它的使用技巧。ChatGPT 的难点，在于 Prompt（提示词）的编写，OpenAI 创始人在今年 2 月时，在 Twitter 上说：「能够出色编写 Prompt …

阅读更多...

视觉合集5~2022

视觉合集5~2022

发一个合集总结一些2022年的一些论文视觉 Transformer（ViT）学习什么？ 论文链接：https://arxiv.org/pdf/2212.06727.pdf 关于视觉的探索显示，ViT 学习的归纳偏置或特征与卷积神经网络（CNN）学…

阅读更多...

2022年最值得关注的十篇论文，你都看了吗？来卷来学习

2022年最值得关注的十篇论文，你都看了吗？来卷来学习

2023 点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院计算机视觉研究院专栏作者：Edison_G 年关将至，威斯康星大学助理教授 Sebastian Raschka 盘点了 2022 年他最看好的十大论文。公众号ID｜ComputerVisionGzq 学习群&#xff5…

阅读更多...

2022年盘点：最值得关注的十篇机器学习论文

2022年盘点：最值得关注的十篇机器学习论文

来源：机器之心计算机视觉与机器学习本文约4000字，建议阅读8分钟威斯康星大学助理教授 Sebastian Raschka 盘点了 2022 年他最看好的十大论文。 2022 年 1 月，扩散模型第一次吸引了我的眼球。当时我判断到将会有某些大事发生，然…

阅读更多...

pycharm 黄色（黄字）高亮警告 Default argument value is mutable 原因及解决办法（mutable 可变对象与 immutable不可变对象）

pycharm 黄色（黄字）高亮警告 Default argument value is mutable 原因及解决办法（mutable 可变对象与 immutable不可变对象）

示例解决方案按照参考文章的意思，classesread_class_names(cfg.YOLO.CLASSES）在函数调用时就会创建对象并赋初始值，如果在函数中修改了classes的值，则函数在下一次调用时，就会不会重新初始化值，而以上一…

阅读更多...

关于安装requests库时候异常的一些问题

关于安装requests库时候异常的一些问题

阅读更多...

最新文章

推荐文章