复旦发布国内首个类ChatGPT模型!已开放内测申请,代码将于3月发布

Pine 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

没想到,众人加班加点抢“中国版ChatGPT”热度时,首个国内类ChatGPT模型竟然已经发布了!

砸出这个重磅消息的,不是紧锣密鼓宣传的BAT大厂,也不是直接出手几亿的投资大V,而是这段时间来一直没吭气的复旦大学

事情一出,直接引爆了一众社交媒体,不仅在微博刷出数个热搜话题,知乎更是冲上热榜第一。

02147b5d6b4c5d86202c18b087df1d54.png

各路“ChatGPT爱好者”连夜赶来围观,甚至由于官网访问人数太多,服务器一度被挤爆,又上了一次热搜。

5e2011b63e38e6077d566a820b3a8a21.png

这是怎么回事?

原来,复旦NLP团队这个类ChatGPT模型,发布即面向公众进行内测,甚至连预告都没有:

90638ab0f98e8efad51c92bbc9cc5625.png

紧接着,团队又投下另一颗重磅炸弹:模型3月份就会开源代码

最关键的是模型的名字。

复旦团队用了《流浪地球》里面拥有自我意识的AI——MOSS来命名这一模型,直接把消息热度推上顶峰。

有网友表示,MOSS率先开放至少有一大优势,那就是“获得更多数据”:

ChatGPT有一个巨大的先发优势,就是通过抢先开始公测收集大量用户数据,并且这部分数据现阶段只有人家有。

算法都是成熟且公开的算法,真正的核心其实是数据和硬件。

0dcda3a511899acbeefeae434db210fd.png

说回模型本身。据MOSS自己介绍,它同样具备ChatGPT能实现的这些功能:

问答、文本翻译、摘要总结、故事撰写、情绪分析、建议提供、代码和算法编写等。

c46bbdb79f5c0cf4407ef3eaf5bb7539.gif

但实际测试效果又是如何,具体训练方法和效果会不会有什么差异?

我们一步步来看。

MOSS与ChatGPT相比效果如何?

据团队介绍,MOSS与ChatGPT主要有三大差异

0b25c1d429a21d240d8efe2b8c19b206.png

最主要的就是参数量的不同。MOSS模型的参数量比ChatGPT小了一个数量级。

然后是训练方式的不同。虽然MOSS也是自然语言模型基座训练+理解人类意图对话能力训练,但后者的训练方式与ChatGPT采用的RLHF不同。

复旦团队没有采取人工标注(指令微调)的方式来进行理解对话能力训练,而是基于与其他AI对话模型的交互来训练自己。

没错,相比人类调教,MOSS直接选择和其他AI模型进行对话……

最后是开放程度不同。ChatGPT背后模型目前还没有开源,但MOSS承诺会将代码开源。

说了这么多,MOSS的效果具体如何?

从官方给出示例来看,它问答和生成代码的能力似乎还不错。

在问答环节中,让MOSS列五部科幻片,分分钟就能给出(不过,《黑镜》好像是电视剧?):

8da20ecb6867c80a394367aae5e9ebe9.png

做表格的速度也非常快:

4709bb607d07d6d5940a285f2cae058d.png

在代码生成中,写个快速排序算法也没问题:

eddc55a4b5955d1804e693cda531dda3.png

与ChatGPT相比,MOSS的实测效果究竟如何呢?

知乎已经有匿名用户称已经拿到了内测资格,并实时更新了一波测试结果,我们将MOSS的回答与ChatGPT简单对比一下。

75840f0c5b81d6e8acc2ceb1e10f1967.png

第一轮,先来看看写文章的能力。

例如“帮忙写一下国家自然科学基金申请,杰青那种”,MOSS回答如下:

e9b344474a339a54f337bfde901a28b9.png

我们把问题拿给ChatGPT后,得到了这样的回答:

61ed8594c43fe0def6784062c7933bf3.png

第二轮,来看看写代码的能力。

d2336bf5ad01f9641a37d660353106e6.png

这是MOSS给出的代码实现:

完整代码:for(i=1:length(mat文件中的名字)){name = mat文件中的名字[i];data = {name};fprintf(‘%s,’,name);}end for

这是ChatGPT给出的代码与回答:

1ab82999b837b8cf7c457ed8e0b7b539.png

第三轮,测试一下算法题的效果。

MOSS给出了一个实现思路:

4bdca711916b9ca8788f6931d9ce00a4.png

ChatGPT则包办了代码和具体算法实现的流程:

7c74aef1a632bbd46d3a20e83d53c325.png

最后一轮,再来看看做数学题的能力。

0987b81a72fcf96c976afada21268544.png

不过从功能介绍来看,MOSS应该还不具备解数学题的能力,这个问题确实不一定能回答出来。

ChatGPT则列了个方程解决这个问题:

1f31c159b487c75ef0bee5b19de7228a.png

整体来看,MOSS虽然在算法题上表现出了一定的逻辑,但在包括写文章、做数学题等具体解决方案的提供上,还有待继续训练提升。

“只是想验证ChatGPT技术路线”

针对种种疑问,团队也在官网上做出了回应。

首先,是MOSS与ChatGPT的差距上。团队表示,目前它还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走:

我们一个实验室无法做出和ChatGPT能力相近的模型,只是想在百亿规模参数上探索和验证ChatGPT的技术路线。

接下来,是针对服务器被挤爆的回应:

我们没想到会引起这么大关注,计算资源不足以支持如此大访问量,向大家致以真诚的歉意。

最后还有关于命名MOSS的回应:

就像过去NLP领域的其他优秀模型一样,作者们都希望使用自己喜欢的影视角色名称命名自己的模型。

d478a2825272936f03c07fd01b290cb1.png

此外,研究团队还在介绍网站中详细列出了MOSS的限制因素:

  • 训练数据中的多语言语料库有限;

  • 模型容量相对较小,不包含足够的世界知识;

  • 执行方式比较迂回,甚至不按照指示执行;

  • 可能会生产不道德或有害的内容;
    ……

总结下来,就是MOSS的回答不及ChatGPT就是因为它缺乏高质量的数据、计算资源以及模型容量

不过,有意思的是,团队表示,在这些问题里面MOSS的最大短板是中文水平不够高

a7d68ef720dc3a5edf002b6cd23c3572.png

具体来说,相较于英文问答能力,MOSS的中文问答水平要低很多,这也与前面提到的预训练模型学习数据量有关:

它的模型基座学习了3000多亿个英文单词,而互联网上的中文网页干扰信息如广告很多,清洗难度很大,导致中文词语只学了约300亿个

目前,复旦大学NLP实验室正在加紧推进中文语料的清洗工作,清洗后的高质量中文语料也将用于下一阶段模型训练。

当然,和ChatGPT相比,MOSS也不是“一无是处”(手动狗头),起码它会在3月份开源代码

79585ce4f27f6f2b3c9989c11e815231.png

而这一把也将会直接有效降低预训练语言模型的研发和应用门槛,属实是利好中小企业了,邱锡鹏教授也表示:

MOSS的计算量相对不那么大,中小企业都能用起来。

此外,研究团队对MOSS的“野心”似乎还不止于对话问答、写代码等这些ChatGPT拥有的功能。

在这次面向公众内测的同时,团队还透露出了MOSS的下一步计划:

结合复旦在人工智能和相关交叉学科的研究成果,赋予MOSS更多的能力,如绘图、语音、谱曲和教学,并加强它辅助科学家进行高效科研的能力等。

研究团队

MOSS是复旦大学自然语言处理实验室的成果,并且该项目还得到了上海人工智能实验室的支持。

研究团队由邱锡鹏带队,其余几位均为复旦大学NLP实验室的成员。

92f0cbd3bfa7a03de97a978523da561a.png

复旦大学自然语言处理实验室,是由复旦大学首席教授吴立德先生创建,是我国最早开展自然语言处理和信息检索研究的实验室之一。

18cc640a6f6b1f00aa27b584c57ddc94.png

目前实验室已经发表了大量高水平国际期刊和会议论文,其中包括中国计算机学会推荐的A/B类国际会议和期刊论文(ACL,SIGIR,IJCAI,AAAI,NIPS,ICML等)论文150余篇。

此外,复旦NLP实验室还发布了国内首家中文自然语言开源系统FudanNLP,被包括联合国教科文组织在内的国内外多家研发机构采用。

邱锡鹏,复旦大学计算机科学技术学院教授,博士生导师,研究方向为自然语言处理、深度学习,发表CCF-A/B类论文70余篇。

cb6bb31dd098c2a10462b275aca0fdd7.png

他还主持开发了开源自然语言处理工具:FudanNLP 、FastNLP,获得了学术界和产业界的广泛使用。

对于复旦MOSS模型的发布,你的看法是?

参考链接:
[1] https://txsun1997.github.io/blogs/moss.html
[2] https://www.shobserver.com/staticsg/res/html/web/newsDetail.html?id=584634
[3] https://www.zhihu.com/question/585248111/answer/2903204899
[4] https://xpqiu.github.io/index.html

《中国AIGC产业全景报告暨AIGC 50》调研启动

谁会是中国的“ChatGPT”?最有竞争力和潜力的AIGC力量位于何方?

量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集,期待有更多优秀的机构、产品、案例与技术能够被大众看到。

b1c17cbf16a6b4ef72a338f105cbd2b1.png

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6433.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一周AIGC丨大模型融资火热,天才、名校、大厂争相下场

2023年进入下半年,明显感受到大模型赛道的融资消息变多了。相比以往出现的移动互联网、区块链、元宇宙等热门赛道,大模型的创业者“科技含量”更高了,创始人要么是研究AI的天才,要么是曾在大公司里负责AI业务的高管。大模型&#…

王飞跃|关于 AI for Science问答

作者|王飞跃,缪青海,张军平,郑文博,丁文文 为贯彻落实国家《新一代人工智能发展规划》,科技部会同自然科学基金委近期启动“人工智能驱动的科学研究”(AI for Science)专项部署工作。…

完犊子!要被封了,坚持还是放弃?看你们的了

「 静静地做自己,让世界发现你 」 ▼ 科技毒瘤君将不定时分享优质工具,大家可以把科技毒瘤君公众号设为★星标,第一时间获取最新推送,以防错过优质内容。 题外话 真正可怕之处 昨天晚上,熬夜给大家分享了一波优质网站&…

Mathemetica 35周年!从天才物理学家到“自大狂”,创始人Wolfram的传奇经历

尚恩 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 头发和显示器都更薄了,但35年前的代码还能运行! 著名科学计算软件Mathematica 35周年之际,创始人Stephen Wolfram发布这样一组构图一毛一样的对比照片,并称: 35年前领先于…

从天才物理学家到“自大狂”,创始人Wolfram的传奇经历

尚恩 梦晨 发自 凹非寺转发自量子位 | 公众号 QbitAI 头发和显示器都更薄了,但35年前的代码还能运行! 著名科学计算软件Mathematica 35周年之际,创始人Stephen Wolfram发布这样一组构图一毛一样的对比照片,并称: 35年前…

科学观察 | 人工智能驱动的科学研究新范式: 从 AI4S 到智能科学

本文刊载于《中国科学院院刊》2023年第4期 “科学观察” 王飞跃1 缪青海2 1 中国科学院自动化研究所 复杂系统管理与控制国家重点实验室 2 中国科学院大学 人工智能学院 近期,以 ChatGPT 为代表的大模型技术正开启人类社会智能化的新纪元。研究人工智能成功…

AI壁纸号一周增加上千粉丝,轻松变现的成功案例分享

前言 随着AI绘画技术的发展,传统的互联网副业壁纸号在新的技术加持下迎来了第二春。本文将分享一位壁纸号创作者的成功案例,并为大家提供创作门槛和硬件要求等相关信息。 该项目的创作门槛极低,基本上可以由AI完成内容创作。不过&#xff0…

win10系统切换到macOS,开发环境与软件资源,目录清单

文章目录 1、生活2、文书3、开发4、算法5、美术6、科研 1、因为考研自习室或学校图书馆,随身携带游戏本(全能本)受限于不插电源就不续航和掉性能,以及风扇噪音非常大,以及发热很烫等问题。 2、所以想考虑给主力机换个…

DNSPod十问徐羽:ChatGPT是国产浏览器的背水一战?

本期嘉宾 徐羽 腾讯信息平台与服务线CTO 徐羽,腾讯信息平台与服务线CTO兼总经理、PCG事业群推荐与AI中台负责人。从2009年开始负责手机QQ浏览器从0起步到现在亿级DAU规模的研发工作,在2018年建立和负责PCG的推荐AI中台,在机器学习平台、NLP…

[ChatGPT4编程笔记]php连接数据库增加数据,修改数据,查询数据,删除数据的demo,有html交互页面

以下是一个示例&#xff0c;演示如何使用 PHP 连接 MySQL 数据库&#xff0c;并实现增加数据、修改数据、查询数据和删除数据的功能。该示例结合了 HTML 和 PHP&#xff0c;并提供了交互页面。index.html&#xff08;交互页面&#xff09;&#xff1a;html Copy code <!DOCT…

“谷歌杀手”发明者,科学天才 Wolfram

有一位少年天才&#xff0c;15岁发表首篇粒子物理方面的学术论文。19岁到加州理工学院研究基本粒子物理学&#xff0c;一年内获得理论物理学博士学位。随后他和费曼一起研究起元胞自动机。 他在成为伊利诺斯大学的物理学、数学和计算机科学教授后&#xff0c;不安于在研究所做研…

2023版本ChatGPT是这样评价电影版《灌篮高手》

尽管大多数人觉得《灌篮高手》电影版非常精彩&#xff0c;但是就我而言&#xff0c;我却有些失望。提前五六天我就买好了电影票&#xff0c;期待能用这部电影重燃曾经的激情&#xff0c;怀念我的青春岁月。然而&#xff0c;在观影两个小时之后&#xff0c;我意识到对这部电影抱…

圆石重磅 | ChatGPT并非真正的人工智能?AI拐点是出现新体系 | 武卿对话刘伟

Datawhale干货 分享人&#xff1a;武卿、刘伟博士 “人工智能的飞速发展&#xff0c;为未来增加了诸多不确定性&#xff0c;未来的世界更加不可预测。 ChatGPT问世以来&#xff0c;在全球范围内掀起了一场科技革命&#xff0c;人工智能的飞速发展&#xff0c;为未来增加了诸多…

“递归三要素”寻踪(浅析递归“经典”框架,领略递归优雅秀气;看到有“递归算法优化”的操作,余试剖之)

浅析递归“经典”框架&#xff0c;领略递归优雅秀气。看到有“递归算法优化”的操作&#xff0c;余试剖之。 【学习的细节是欢悦的历程】 Python 官网&#xff1a;https://www.python.org/ Free&#xff1a;大咖免费“圣经”教程《 python 完全自学教程》&#xff0c;不仅仅是…

自带超多工具,好用又免费,这3款手机浏览器你用过了吗

手机浏览器是我们手机中必备的一款软件APP&#xff0c;一款好用的浏览器&#xff0c;可以帮助我们提高工作效率&#xff0c;节省时间。对于懒癌患者来说&#xff0c;手机上安装各种各种的app很麻烦&#xff0c;下面给大家介绍自带超多的工具&#xff0c;好用且免费的浏览器&…

【C】2、C语言介绍

一、C语言 C语言是一种面向过程的计算机程序设计语言&#xff0c;于1972年由美国贝尔实验室的Dennis Ritchie所开发。C语言广泛应用于操作系统、编译器、网络通信等方面&#xff0c;也是很多高级语言的底层实现基础。 C语言具有简洁、高效、可移植性好等特点&#xff0c;以及…

New bing、ChatGPT、SQL Studio是如何优化SQL查询的?

首先&#xff0c;让我们看一下New Bing。 New Bing是一种搜索引擎&#xff0c;可以帮助我们查找与我们正在寻找的主题相关的信息。我们可以使用New Bing来解释SQL语句&#xff0c;也能帮助我们分析SQL语句的执行效率&#xff0c;此外呢&#xff0c;也能帮助我们检查一下语法与逻…

如何使用 ChatGPT 编写 SQL JOIN 查询

通过清晰的示例和解释&#xff0c;本文展示了 ChatGPT 如何简化和简化创建复杂 MySQL 查询的过程&#xff0c;使用户更容易与数据库交互并检索他们需要的数据。无论您是初学者还是经验丰富的开发人员&#xff0c;本文都提供了有关如何利用 ChatGPT 来增强您的 MySQL 查询编写技…

数据库+chatGPT3.5 优化、索引、注释、写SQL就是一句话的事了

引言 3月份chatGPT是不安分的、微软是不安分的、那么勇哥就应该安分&#xff1f;不可能&#xff0c;绝对不可能。简单来说&#xff0c;勇哥3月份成功的把chatGPT3.5集成到bg-tinkle软件中发布了v1.0.5版本。集成后的bg-tinkle对于数据库的修改、统计、删除等操作就都是一句话的…

用ChatGPT帮我进行SQL调优,sql 调优再也没有那么难了

文章目录 问题背景先看一下调整前的 sql功能说明问题分析 通过 ChatGPT 优化此 SQL&#xff08;sql 调优再也没有那么难了&#xff09;准备一下&#xff0c;如何向 gpt 发出提问第一次提问&#xff08;没解决问题&#xff0c;但是一定要看&#xff0c;并不是 GPT 的错&#xff…