复旦发布国内首个类ChatGPT模型！已开放内测申请，代码将于3月发布

复旦发布国内首个类ChatGPT模型！已开放内测申请，代码将于3月发布

news/2024/12/24 22:13:01/文章来源:https://blog.csdn.net/QbitAI/article/details/129153200

Pine 萧箫发自凹非寺
量子位 | 公众号 QbitAI

没想到，众人加班加点抢“中国版ChatGPT”热度时，首个国内类ChatGPT模型竟然已经发布了！

砸出这个重磅消息的，不是紧锣密鼓宣传的BAT大厂，也不是直接出手几亿的投资大V，而是这段时间来一直没吭气的复旦大学。

事情一出，直接引爆了一众社交媒体，不仅在微博刷出数个热搜话题，知乎更是冲上热榜第一。

各路“ChatGPT爱好者”连夜赶来围观，甚至由于官网访问人数太多，服务器一度被挤爆，又上了一次热搜。

这是怎么回事？

原来，复旦NLP团队这个类ChatGPT模型，发布即面向公众进行内测，甚至连预告都没有：

紧接着，团队又投下另一颗重磅炸弹：模型3月份就会开源代码。

最关键的是模型的名字。

复旦团队用了《流浪地球》里面拥有自我意识的AI——MOSS来命名这一模型，直接把消息热度推上顶峰。

有网友表示，MOSS率先开放至少有一大优势，那就是“获得更多数据”：

ChatGPT有一个巨大的先发优势，就是通过抢先开始公测收集大量用户数据，并且这部分数据现阶段只有人家有。

算法都是成熟且公开的算法，真正的核心其实是数据和硬件。

说回模型本身。据MOSS自己介绍，它同样具备ChatGPT能实现的这些功能：

问答、文本翻译、摘要总结、故事撰写、情绪分析、建议提供、代码和算法编写等。

但实际测试效果又是如何，具体训练方法和效果会不会有什么差异？

我们一步步来看。

MOSS与ChatGPT相比效果如何？

据团队介绍，MOSS与ChatGPT主要有三大差异。

最主要的就是参数量的不同。MOSS模型的参数量比ChatGPT小了一个数量级。

然后是训练方式的不同。虽然MOSS也是自然语言模型基座训练+理解人类意图对话能力训练，但后者的训练方式与ChatGPT采用的RLHF不同。

复旦团队没有采取人工标注（指令微调）的方式来进行理解对话能力训练，而是基于与其他AI对话模型的交互来训练自己。

没错，相比人类调教，MOSS直接选择和其他AI模型进行对话……

最后是开放程度不同。ChatGPT背后模型目前还没有开源，但MOSS承诺会将代码开源。

说了这么多，MOSS的效果具体如何？

从官方给出示例来看，它问答和生成代码的能力似乎还不错。

在问答环节中，让MOSS列五部科幻片，分分钟就能给出（不过，《黑镜》好像是电视剧？）：

做表格的速度也非常快：

在代码生成中，写个快速排序算法也没问题：

但与ChatGPT相比，MOSS的实测效果究竟如何呢？

知乎已经有匿名用户称已经拿到了内测资格，并实时更新了一波测试结果，我们将MOSS的回答与ChatGPT简单对比一下。

第一轮，先来看看写文章的能力。

例如“帮忙写一下国家自然科学基金申请，杰青那种”，MOSS回答如下：

我们把问题拿给ChatGPT后，得到了这样的回答：

第二轮，来看看写代码的能力。

这是MOSS给出的代码实现：

完整代码：for(i=1:length(mat文件中的名字)){name = mat文件中的名字[i];data = {name};fprintf(‘%s,’,name);}end for

这是ChatGPT给出的代码与回答：

第三轮，测试一下算法题的效果。

MOSS给出了一个实现思路：

ChatGPT则包办了代码和具体算法实现的流程：

最后一轮，再来看看做数学题的能力。

不过从功能介绍来看，MOSS应该还不具备解数学题的能力，这个问题确实不一定能回答出来。

ChatGPT则列了个方程解决这个问题：

整体来看，MOSS虽然在算法题上表现出了一定的逻辑，但在包括写文章、做数学题等具体解决方案的提供上，还有待继续训练提升。

“只是想验证ChatGPT技术路线”

针对种种疑问，团队也在官网上做出了回应。

首先，是MOSS与ChatGPT的差距上。团队表示，目前它还是一个非常不成熟的模型，距离ChatGPT还有很长的路需要走：

我们一个实验室无法做出和ChatGPT能力相近的模型，只是想在百亿规模参数上探索和验证ChatGPT的技术路线。

接下来，是针对服务器被挤爆的回应：

我们没想到会引起这么大关注，计算资源不足以支持如此大访问量，向大家致以真诚的歉意。

最后还有关于命名MOSS的回应：

就像过去NLP领域的其他优秀模型一样，作者们都希望使用自己喜欢的影视角色名称命名自己的模型。

此外，研究团队还在介绍网站中详细列出了MOSS的限制因素：

训练数据中的多语言语料库有限；
模型容量相对较小，不包含足够的世界知识；
执行方式比较迂回，甚至不按照指示执行；
可能会生产不道德或有害的内容；
……

总结下来，就是MOSS的回答不及ChatGPT就是因为它缺乏高质量的数据、计算资源以及模型容量。

不过，有意思的是，团队表示，在这些问题里面MOSS的最大短板是中文水平不够高。

具体来说，相较于英文问答能力，MOSS的中文问答水平要低很多，这也与前面提到的预训练模型学习数据量有关：

它的模型基座学习了3000多亿个英文单词，而互联网上的中文网页干扰信息如广告很多，清洗难度很大，导致中文词语只学了约300亿个。

目前，复旦大学NLP实验室正在加紧推进中文语料的清洗工作，清洗后的高质量中文语料也将用于下一阶段模型训练。

当然，和ChatGPT相比，MOSS也不是“一无是处”（手动狗头），起码它会在3月份开源代码。

而这一把也将会直接有效降低预训练语言模型的研发和应用门槛，属实是利好中小企业了，邱锡鹏教授也表示：

MOSS的计算量相对不那么大，中小企业都能用起来。

此外，研究团队对MOSS的“野心”似乎还不止于对话问答、写代码等这些ChatGPT拥有的功能。

在这次面向公众内测的同时，团队还透露出了MOSS的下一步计划：

结合复旦在人工智能和相关交叉学科的研究成果，赋予MOSS更多的能力，如绘图、语音、谱曲和教学，并加强它辅助科学家进行高效科研的能力等。

研究团队

MOSS是复旦大学自然语言处理实验室的成果，并且该项目还得到了上海人工智能实验室的支持。

研究团队由邱锡鹏带队，其余几位均为复旦大学NLP实验室的成员。

复旦大学自然语言处理实验室，是由复旦大学首席教授吴立德先生创建，是我国最早开展自然语言处理和信息检索研究的实验室之一。

目前实验室已经发表了大量高水平国际期刊和会议论文，其中包括中国计算机学会推荐的A/B类国际会议和期刊论文（ACL,SIGIR,IJCAI,AAAI,NIPS,ICML等）论文150余篇。

此外，复旦NLP实验室还发布了国内首家中文自然语言开源系统FudanNLP，被包括联合国教科文组织在内的国内外多家研发机构采用。

邱锡鹏，复旦大学计算机科学技术学院教授，博士生导师，研究方向为自然语言处理、深度学习，发表CCF-A/B类论文70余篇。

他还主持开发了开源自然语言处理工具：FudanNLP 、FastNLP，获得了学术界和产业界的广泛使用。

对于复旦MOSS模型的发布，你的看法是？

参考链接：
[1] https://txsun1997.github.io/blogs/moss.html
[2] https://www.shobserver.com/staticsg/res/html/web/newsDetail.html?id=584634
[3] https://www.zhihu.com/question/585248111/answer/2903204899
[4] https://xpqiu.github.io/index.html

— 完 —

《中国AIGC产业全景报告暨AIGC 50》调研启动

谁会是中国的“ChatGPT”？最有竞争力和潜力的AIGC力量位于何方？

量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集，期待有更多优秀的机构、产品、案例与技术能够被大众看到。

点这里👇关注我，记得标星哦～

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/6433.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

一周AIGC丨大模型融资火热，天才、名校、大厂争相下场

一周AIGC丨大模型融资火热，天才、名校、大厂争相下场

2023年进入下半年，明显感受到大模型赛道的融资消息变多了。相比以往出现的移动互联网、区块链、元宇宙等热门赛道，大模型的创业者“科技含量”更高了，创始人要么是研究AI的天才，要么是曾在大公司里负责AI业务的高管。大模型&#…

阅读更多...

王飞跃｜关于 AI for Science问答

王飞跃｜关于 AI for Science问答

作者｜王飞跃，缪青海，张军平，郑文博，丁文文为贯彻落实国家《新一代人工智能发展规划》，科技部会同自然科学基金委近期启动“人工智能驱动的科学研究”（AI for Science）专项部署工作。…

阅读更多...

完犊子！要被封了，坚持还是放弃？看你们的了

完犊子！要被封了，坚持还是放弃？看你们的了

「静静地做自己，让世界发现你」 ▼ 科技毒瘤君将不定时分享优质工具，大家可以把科技毒瘤君公众号设为★星标，第一时间获取最新推送，以防错过优质内容。题外话真正可怕之处昨天晚上，熬夜给大家分享了一波优质网站&…

阅读更多...

Mathemetica 35周年！从天才物理学家到“自大狂”，创始人Wolfram的传奇经历

Mathemetica 35周年！从天才物理学家到“自大狂”，创始人Wolfram的传奇经历

尚恩梦晨发自凹非寺量子位 | 公众号 QbitAI 头发和显示器都更薄了，但35年前的代码还能运行！ 著名科学计算软件Mathematica 35周年之际，创始人Stephen Wolfram发布这样一组构图一毛一样的对比照片，并称： 35年前领先于…

阅读更多...

从天才物理学家到“自大狂”，创始人Wolfram的传奇经历

从天才物理学家到“自大狂”，创始人Wolfram的传奇经历

尚恩梦晨发自凹非寺转发自量子位 | 公众号 QbitAI 头发和显示器都更薄了，但35年前的代码还能运行！ 著名科学计算软件Mathematica 35周年之际，创始人Stephen Wolfram发布这样一组构图一毛一样的对比照片，并称： 35年前…

阅读更多...

科学观察 | 人工智能驱动的科学研究新范式: 从 AI4S 到智能科学

科学观察 | 人工智能驱动的科学研究新范式: 从 AI4S 到智能科学

本文刊载于《中国科学院院刊》2023年第4期 “科学观察” 王飞跃1 缪青海2 1 中国科学院自动化研究所复杂系统管理与控制国家重点实验室 2 中国科学院大学人工智能学院近期，以 ChatGPT 为代表的大模型技术正开启人类社会智能化的新纪元。研究人工智能成功…

阅读更多...

AI壁纸号一周增加上千粉丝，轻松变现的成功案例分享

AI壁纸号一周增加上千粉丝，轻松变现的成功案例分享

前言随着AI绘画技术的发展，传统的互联网副业壁纸号在新的技术加持下迎来了第二春。本文将分享一位壁纸号创作者的成功案例，并为大家提供创作门槛和硬件要求等相关信息。该项目的创作门槛极低，基本上可以由AI完成内容创作。不过&#xff0…

阅读更多...

win10系统切换到macOS，开发环境与软件资源，目录清单

win10系统切换到macOS，开发环境与软件资源，目录清单

文章目录 1、生活2、文书3、开发4、算法5、美术6、科研 1、因为考研自习室或学校图书馆，随身携带游戏本（全能本）受限于不插电源就不续航和掉性能，以及风扇噪音非常大，以及发热很烫等问题。 2、所以想考虑给主力机换个…

阅读更多...

DNSPod十问徐羽：ChatGPT是国产浏览器的背水一战？

DNSPod十问徐羽：ChatGPT是国产浏览器的背水一战？

本期嘉宾徐羽腾讯信息平台与服务线CTO 徐羽，腾讯信息平台与服务线CTO兼总经理、PCG事业群推荐与AI中台负责人。从2009年开始负责手机QQ浏览器从0起步到现在亿级DAU规模的研发工作，在2018年建立和负责PCG的推荐AI中台，在机器学习平台、NLP…

阅读更多...

[ChatGPT4编程笔记]php连接数据库增加数据,修改数据，查询数据，删除数据的demo，有html交互页面

[ChatGPT4编程笔记]php连接数据库增加数据,修改数据，查询数据，删除数据的demo，有html交互页面

以下是一个示例，演示如何使用 PHP 连接 MySQL 数据库，并实现增加数据、修改数据、查询数据和删除数据的功能。该示例结合了 HTML 和 PHP，并提供了交互页面。index.html（交互页面）：html Copy code <!DOCT…

阅读更多...

“谷歌杀手”发明者，科学天才 Wolfram

“谷歌杀手”发明者，科学天才 Wolfram

有一位少年天才，15岁发表首篇粒子物理方面的学术论文。19岁到加州理工学院研究基本粒子物理学，一年内获得理论物理学博士学位。随后他和费曼一起研究起元胞自动机。他在成为伊利诺斯大学的物理学、数学和计算机科学教授后，不安于在研究所做研…

阅读更多...

2023版本ChatGPT是这样评价电影版《灌篮高手》

2023版本ChatGPT是这样评价电影版《灌篮高手》

尽管大多数人觉得《灌篮高手》电影版非常精彩，但是就我而言，我却有些失望。提前五六天我就买好了电影票，期待能用这部电影重燃曾经的激情，怀念我的青春岁月。然而，在观影两个小时之后，我意识到对这部电影抱…

阅读更多...

圆石重磅 | ChatGPT并非真正的人工智能？AI拐点是出现新体系 | 武卿对话刘伟

圆石重磅 | ChatGPT并非真正的人工智能？AI拐点是出现新体系 | 武卿对话刘伟

Datawhale干货分享人：武卿、刘伟博士 “人工智能的飞速发展，为未来增加了诸多不确定性，未来的世界更加不可预测。 ChatGPT问世以来，在全球范围内掀起了一场科技革命，人工智能的飞速发展，为未来增加了诸多…

阅读更多...

“递归三要素”寻踪（浅析递归“经典”框架，领略递归优雅秀气；看到有“递归算法优化”的操作，余试剖之）

“递归三要素”寻踪（浅析递归“经典”框架，领略递归优雅秀气；看到有“递归算法优化”的操作，余试剖之）

浅析递归“经典”框架，领略递归优雅秀气。看到有“递归算法优化”的操作，余试剖之。【学习的细节是欢悦的历程】 Python 官网：https://www.python.org/ Free：大咖免费“圣经”教程《 python 完全自学教程》，不仅仅是…

阅读更多...

自带超多工具，好用又免费，这3款手机浏览器你用过了吗

自带超多工具，好用又免费，这3款手机浏览器你用过了吗

手机浏览器是我们手机中必备的一款软件APP，一款好用的浏览器，可以帮助我们提高工作效率，节省时间。对于懒癌患者来说，手机上安装各种各种的app很麻烦，下面给大家介绍自带超多的工具，好用且免费的浏览器&…

阅读更多...

【C】2、C语言介绍

【C】2、C语言介绍

一、C语言 C语言是一种面向过程的计算机程序设计语言，于1972年由美国贝尔实验室的Dennis Ritchie所开发。C语言广泛应用于操作系统、编译器、网络通信等方面，也是很多高级语言的底层实现基础。 C语言具有简洁、高效、可移植性好等特点，以及…

阅读更多...

New bing、ChatGPT、SQL Studio是如何优化SQL查询的？

New bing、ChatGPT、SQL Studio是如何优化SQL查询的？

首先，让我们看一下New Bing。 New Bing是一种搜索引擎，可以帮助我们查找与我们正在寻找的主题相关的信息。我们可以使用New Bing来解释SQL语句，也能帮助我们分析SQL语句的执行效率，此外呢，也能帮助我们检查一下语法与逻…

阅读更多...

如何使用 ChatGPT 编写 SQL JOIN 查询

如何使用 ChatGPT 编写 SQL JOIN 查询

通过清晰的示例和解释，本文展示了 ChatGPT 如何简化和简化创建复杂 MySQL 查询的过程，使用户更容易与数据库交互并检索他们需要的数据。无论您是初学者还是经验丰富的开发人员，本文都提供了有关如何利用 ChatGPT 来增强您的 MySQL 查询编写技…

阅读更多...

数据库+chatGPT3.5 优化、索引、注释、写SQL就是一句话的事了

数据库+chatGPT3.5 优化、索引、注释、写SQL就是一句话的事了

引言 3月份chatGPT是不安分的、微软是不安分的、那么勇哥就应该安分？不可能，绝对不可能。简单来说，勇哥3月份成功的把chatGPT3.5集成到bg-tinkle软件中发布了v1.0.5版本。集成后的bg-tinkle对于数据库的修改、统计、删除等操作就都是一句话的…

阅读更多...

用ChatGPT帮我进行SQL调优，sql 调优再也没有那么难了

用ChatGPT帮我进行SQL调优，sql 调优再也没有那么难了

文章目录问题背景先看一下调整前的 sql功能说明问题分析通过 ChatGPT 优化此 SQL（sql 调优再也没有那么难了）准备一下，如何向 gpt 发出提问第一次提问（没解决问题，但是一定要看，并不是 GPT 的错&#xff…

阅读更多...

最新文章

推荐文章