做大模型时代的「Linux」, ChatGPT 仅是开端

1efba292118a84c3052d4823d706bc55.jpeg

大模型只是中间状态,开源的大模型技术生态才是未来。

来源:AI科技评论

作者:李梅

编辑:岑峰

一代人的时间里总会有几次这样的时刻:一种产品的出现将一项技术从昏暗的工程系地下室、臭气熏天的书呆子们的卧室和业余爱好者们孤独的洞穴中弹射出来,变成了连你的祖母都知道如何使用的东西。

《财富》杂志的这段话,捕捉了1994年网景浏览器和2007年iPhone的历史意义,也描述了今天ChatGPT为人工智能领域带来的变化。

它们都是一个生态体系的开端。ChatGPT的背后是AI大模型,但智能时代的未来不会仅仅是大模型本身,而将是大模型生态体系。

北京智源人工智能研究院院长黄铁军认为,过去的「炼」大模型并非一种正常的状态,AI一定是通过作为公共产品的智力而非个别的大模型来提供服务的。在未来,大模型会有很多,但大模型生态体系不会超过3个。

而要建立提供数据、训练、治理等全套服务的大模型生态体系,并非哪一家企业能为之,需要更多机构一起合作。在黄铁军看来,智能时代需要真开源,不是某一家企业控制下的开源,而是像Linux和RISC-V 那样的开源。

如果不想在这一波AI大模型热潮中被卡脖子,我们只有开源一条路。

为了加快这一步伐,智源研究院在2月28日发布了FlagOpen(飞智)大模型技术开源体系,大模型领域的「Linux」正在诞生。

2882da2c0d564c0101f155c84c3b027b.jpeg

智源研究院院长 黄铁军

1

ChatGPT 水面之下:

回归技术理性

爱迪生曾在曼哈顿的一个街区铺设电网,点亮了那个街区,OpenAI推出ChatGPT也具有同样的局部验证性作用。在大呼惊奇过后,国内各家纷纷赶制中国版ChatGPT,相当于各自建立一个小型电网、为一部分用户服务。

但这距离大模型作为一种产品服务进入到千家万户还有很长一段距离。

我们亟需从ChatGPT的商业化狂潮中回归到技术理性。要看到的是,ChatGPT作为一个产品只是水面上的冰山一角,水面之下是大模型的底层技术体系。

一方面,商业模式尚未清晰,大模型的战略“占位”意图更加明显,仅少数玩家具备技术基础的相对充分累积。而总资源有限,算力稀缺,资本驱动的模式可能会导致重复性浪费,影响潜在的技术进步可能性。

另一方面,如今的大模型虽然已经足够大,但将来要走什么样的技术路线还是一个开放的问题,有许多问题尚待解决,比如是否会有新的架构和算法、如何解释大模型的涌现能力、怎么提高大模型的高级认知能力等等。

不仅仅是科学问题,在大模型的产业化过程中,如何用更少的计算成本、智能水平更高的大模型去提供AI服务,也需要长期考虑。就像有了发电厂之后,仍要继续钻研提高发电效率的技术,研究家庭用电接口的方式等等。

所以,中国是否也要做一个ChatGPT出来?基于当前匆匆回应,也许不如进一步面向未来看问题—— 如何驱动整个大模型产业及生态产生越来越多令人惊喜的AI现象?

「大模型只是冰山一角,我们要在大模型磅礴的大生态中找准自己的历史性位置。」黄铁军认为,大模型是一种中间状态,它不是最终的服务形态,而是现阶段用特定技术、特定算法训练出来的结果。未来的形态应当是以大模型为技术手段、向所有人提供24×7服务的智能运营系统。

如同今天的通信网络运营商仅有几家巨头,将来大模型的服务运营体系也会屈指可数——但庞大的产业群带来的商业机遇会更多。

从技术出发建立生态,需要一个协作的方式。研究人员提出不同的大模型技术创新,并汇聚到一个开源开放的技术体系下,去展示能力、评估和比较。而且,不是止步于造一个大模型出来,而是持续地进行技术迭代。

智源联合多家产学研单位建立大模型技术开源体系FlagOpen,正是面向这样一个长远的命题:在智能时代以大模型为代表的产业体系中,我们应该做些什么?

而无论是从对前沿技术的重视程度还是组织的中立性来看,智源作为非营利研究机构做大模型开源这件事是再合适不过。

2

从大模型引领者到开源先锋

「某种意义上,我们是后退一步,而不是去赶一个热点。」黄铁军说道。

在各路势力一个接一个宣称入局ChatGPT的热潮中,智源推出国内首个大模型开源体系,也更加希望保持冷静的理性思考,探索还能为人工智能前沿研发底层环境做些什么。

作为非营利机构,智源一直聚焦打造有重大技术挑战、需要紧密工程协作、长期攻关的重大系统级成果。相较于近期的商业化热潮,智源显然更关心技术本身,与大模型领域的长期发展。

大模型在中国起飞之初,智源是当之无愧的引领者。过去几年,已经积累了冰山之下大模型的技术栈。这是智源做大模型开源这件事的底气。

坐落在「宇宙中心」五道口,智源汇聚了来自北大、清华、人大、中科院等学术高地的AI人才。作为中立非营利创新科研机构,相比高校与企业,一方面可以更好地汇集企业、学界资源集中力量做大事;另一方面非商业不逐利,愿意尊重科研创新规律,让科研人员在自由的环境中充分进行创造力探索。

对有价值问题的聚焦,使得其成为上一波大模型热潮中的头雁

2020年OpenAI发布GPT-3,智源立即喊出“大模型时代即将到来”的AI未来图景,坚定奔走推动大模型研究路线,并迅速组织了“悟道”大模型攻关团队,训练出了中文预训练语言模型CPM。“悟道”团队的成员,目前已成为国内大模型研究的中坚力量。

之后,智源继续加大对大模型的投入,在2021年3月发布了大模型项目“悟道1.0”,包含中文语言、图文多模态、认知和蛋白质序列预测四个方向的模型。3个月后,智源又推出创造当时“全球最大”纪录的“悟道2.0”大模型项目。

如今,大模型无限堆参数的热潮已经冷却,如何在大模型的封闭生态形成前,推动建立大模型开源体系,拥抱开源开放,鼓励人工智能的底层技术创新集体热情?

黄铁军断言:「不可能、也不应该有任何一家企业来完全封闭地主导大模型这么一个重要的方向。」

大模型的重要性在于,它通过一个通用模型来完成多场景任务,作为底座能够诞生无数AI应用,因而是AI时代的基础设施。而从技术层面来讲,当前的大模型仍具有诸多难以透彻理解的黑箱特性,因此更加需要以开源开放的方式让大模型更安全地提供服务。

而开源本身也已经成为必然趋势。以操作系统为例,为何大家都愿意用开源的操作系统?对于商业公司而言,使用开源产品带来的并非仅仅是成本的降低,更重要的是风险的降低和质量的提高。由一家企业维护的闭源项目一旦终止,用户就要迁移全部技术栈,但开源不会出现这种风险,而且技术问题在开源的情况下也能更快得到解决。

对于研发成本极大的大模型而言,开源更是能够集约资源、汇聚人类智慧,避免重复造轮子。智源已经在大模型开源这条路上走了一段距离。「悟道」系列模型已经在持续开源,包括「悟道2.0」通用语言大模型GLM、「悟道3.0」视觉预训练大模型EVA、视觉通用多任务模型Painter、文生图大模型AltDiffusion等等。

过去,智源汇集承载产学研各界力量推动大模型研究事业;现在,智源正在推进更艰巨的大模型开源开放生态建设——推出了FlagOpen(飞智)大模型技术开源体系。

3

FlagOpen:大模型时代的「Linux」

大模型的技术创新涉及算法、模型、数据、工具、评测等各个层面,因此FlagOpen开源体系也全面涵盖了这些模块,能够让开发者和企业更快、更低门槛地上手大模型的研发。

智源之所以选择在当下发布FlagOpen开源体系,其中一个考虑也是因为看到在这一波ChatGPT热潮中,许多以往没有大模型研发经验的初创团队,也开始尝试自研大模型,对他们而言,FlagOpen来得非常及时。

7e84da4d429955203bf4fd465d23745b.jpeg

FlagOpen开源体系中的重头戏,是一个大模型算法、模型及工具一站式开源项目FlagAI。该项目已经涵盖了各领域的一些明星大模型,如语言大模型OPT、T5,视觉大模型ViT、Swin Transformer,多模态大模型CLIP等,以及智源自家的大模型。

这些大模型在实际调用和复现过程中的技术门槛很高,为此FlagAI集成了很多主流大模型算法技术,以及多种大模型并行处理和训练加速技术,并且支持微调,开箱即用的方式对开发者非常友好。

大模型生态的另一要素是AI硬件评测,AI软硬件技术栈异构程度高、兼容性差,应用场景复杂多变,都给评测带来了很多挑战。

FlagPerf搭建的AI硬件评测体系,提供了可直接下载且适配各家芯片的整套评测软件,能大大降低用户企业和芯片企业的人力成本。

FlagPerf的推出,也体现了智源开源开放的决心。一方面,不同于目前知名的AI基准评测MLperf,FlagPerf不搞排名榜单,且及时跟进最新的大模型基准;另一方面,其他大厂企业做的评测本身有其商业诉求,不够开放,而智源作为中立机构,建立评测体系的目的是为了让大模型产业更加成熟,所以评测涵盖各种芯片,而非仅仅某一款,并且支持多种深度学习框架,对用户企业的选择不加限制。

也正因如此,智源第一时间就把多个厂商和团队拉了进来,包括天数智芯、百度PaddlePaddle、昆仑芯科技、中国移动等,一同推进AI硬件评测建设。林咏华谈道,「我们首先希望它先变成一个事实的基准。所谓事实基准是大家评测硬件的时候都爱用它,至于未来要不要发展成产业的标准,我们顺其自然。」

科学、公开的大模型评测基准及工具,同样是大模型取得技术进步的重要条件。尤其是当下AIGC的应用越发火热,行业亟需对模型在AI生成任务上的评估。基础大模型评测开源项目FlagEval为此提供了覆盖多种模态和测评维度的评测工具,其中就包括多模态领域的CLIP系列模型。

在数据方面,智源构建了支撑大模型训练的WuDaoCorpora语料库,包含文本、对话、图文对、视频文本对四类数据。FlagData还集成了包含清洗、标注、压缩、统计分析等功能在内的多个数据处理工具与算法。

在AI走向工程化的趋势下,大型数据集的构建正在成为中国的巨大机会,这个过程需要更大、更开放的协作。智源此次发布的OpenLabel是中文世界首个开放数据标注平台,它转动了数据飞轮,正持续为大模型提供训数据源。

除了以上四大模块,FlagOpen开源体系中还涵盖了文生图开源项目集合FlagStudio,以及AI应用微服务框架开源项目FlagBoot,为大模型的研发和应用开放了全方位的能力。

FlagOpen专门围绕大模型而搭建的开源体系,这也是它与其它开源平台的区别所在。国外有HuggingFace、国内有魔搭社区(Model Scope),而关于FlagOpen的定位,林咏华解释:

「我们不只是想构建一个很多人参与的繁华社区,更是希望推动大模型技术的发展。」

从产品的角度讲,FlagOpen为用户在研发大模型的需求上提供了一个更合适的选择。针对“开源的不如闭源”说法,黄铁军认为,开源开放是一个大趋势,开源形式的产品将会占据比较大的份额,而在一个特定方向上某个闭源产品做得更好,这一点并不奇怪。

「这不等于谁打败谁了,而是大家在满足自己需求时所做的不同选择。」就像Linux成功在市场竞争中占据主要份额,但它不是把所有操作系统都打败了。

FlagOpen刚刚迈出了开源第一步。智源开源的策略并非等一切都足够完备再开源,而是把种子点做了之后就开源,这样可以更快地推动企业和团队在非商业合作协议下互相合作。比如,AI 硬件评测开源项目是先从最难也最短缺的训练端做起,这一块做好了推理端便不是难点。

类比13年前云计算开源平台OpenStack的起家,Rackspace和NASA合伙做了Nova并将其作为种子开源,同时成立了OpenStack基金会,让更多企业一起参与贡献,这才有了国内今天所有的云计算厂商。

这也是智源做大模型开源的初心。而对于FlagOpen的未来,智源的期待是将其打造成大模型时代的「Linux」。

「什么叫一个开源项目成功了?就是大多数做产品和服务的企业都用这样的开源体系,就像Linux和Risc-V的开源开放带来了广泛采用,希望FlagOpen在智能时代也能发挥类似的作用。」

FlagOpen开源平台入口:https://flagopen.baai.ac.cn

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

8de1ef1136ec8c765656a29f124e71cd.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9871.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:将Python官网页面切换为中文的SEO优化指南

将Python官网页面切换为中文的SEO优化指南 介绍 在当今数字化时代,为了吸引更多全球用户们的关注,网站所有者们都会将自己的网站翻译成多种语言,Python官网也不例外。本文将会为您详细介绍如何将Python官网页面切换为中文,从而提…

【新手】使用itchat,玩微信自动回复和发送信息给指定联系人

【新手】使用itchat,玩微信自动回复和发送信息给指定联系人 # 写在开头:愿我们都能尘垢不沾俗相不染 编译器:pycharm2019.3 课前简介: itchat是一个开源的微信个人号接口,使用python调用微信从未如此简单。 使用不到…

微信自动回复(python)

前言: 自从微信禁止网页版登陆之后,itchat 库也就都不能用了,新号不能再登录网页版,而且itchat 库在headers里面只放了UserAgent,其他字段都没有放。所以在你登录的瞬间,微信就已经知道你这个账号没有用浏…

代理平台kb-proxy:注册与登录【三】

代理平台介绍 代理工具繁杂,究竟应该选择哪个? 接口测试录入繁复,到底怎么才能简化? mock服务看似美妙,但搭建和使用从来就不那么美好? 今天,给大家推荐一个工具:kb-proxy 一次搭建…

登录之手机号验证码登录

今天测试云之讯api 云之讯官网提供源码只需要修改就好 我的是放入tp5路径如下&#xff1a;前端代码脑补 只有一个input和按钮 直接上代码 index.php <?php namespace app\admin\controller; use think\Db; use think\Loader; use think\Controller; use app\admin\contr…

点击链接跳转到微信公众号关注页、微信关注链接

感觉现在微信又更新了&#xff0c;原来 好好的方法不给用了&#xff0c;可能是微信一直在禁用通过外部链接引导到关注页的举动&#xff0c;不支持。通过重定向跳转至全部消息列表页&#xff0c;关注按钮一闪而过&#xff0c;然后消失了。。。暂时没有好的解决方案。 所以以下文…

实现微信公众号跳转登录外部链接

提示&#xff1a;微信公众平台开发文档&#xff1a;​​​​​​微信公众平台开发概述 | 微信开放文档 (qq.com)​​​​​​ 目录 前言 一、通过与菜单栏产生交互事件 &#xff0c;返回需要跳转的url图文信息 二、使用微信的网页授权机制 1.静默授权和非静默授权 2.静默授权和…

通过链接打开公众号的方法

业务场景&#xff1a; 用户在完成某些业务后&#xff0c;可以快的跳转到公众号,引导客户关注 步骤&#xff1a; 1.在电脑上打开公众号->公众号主页 2.公众号查看历史消息&#xff0c;右键用默认浏览器打开 3.取出链接中的__biz参数 4.最后一步&#xff1a;将第3步…

Matcher: Segment Anything with One Shot Using All-Purpose Feature Matching 论文精读

Matcher: Segment Anything with One Shot Using All-Purpose Feature Matching 论文链接&#xff1a;[2305.13310] Matcher: Segment Anything with One Shot Using All-Purpose Feature Matching (arxiv.org) 代码链接&#xff1a;aim-uofa/Matcher: Matcher: Segment Anyt…

从GPT到ChatGPT:我们离那个理想的AI时代到底还有多远?

写在前面 在2023年新年伊始&#xff0c;科技界最为爆火一款产品无疑是OpenAI公司出品的ChatGPT了&#xff0c;作为一名NLP领域从业者&#xff0c;似乎也好久没有看到如此热闹的技术出圈场景了。诚然从现象来看&#xff0c;无论从效果惊艳度、社会效应、商业价值、科技发展方向…

论文精读:Ansor: Generating High-Performance Tensor Programs for Deep Learning

文章目录 1. Abstract2. Introduction3. Background4. Design Overview5. Program Sampling5.1 Sketch Generation5.2 Random Annotation 6. Performance Fine-tuning6.1 Evolutionary Search6.2 Learned Cost Model 7. Task Scheduler7.1 Problem Formulation7.2 Optimizing w…

研0开始如何读论文

1. 学习别人的方法 论文导读&#xff1a;如何快速掌握一个新的科研方向&#xff1f;一个新手应该怎么读论文&#xff1f; - 知乎 论文导读&#xff1a;如何高效读论文&#xff1f; (zhihu.com) 吴恩达&#xff1a;关于机器学习职业生涯以及阅读论文的一些建议https://www.yo…

论文阅读辅助利器-Zotero-GPT

前言 首先&#xff0c;什么是Zotero&#xff1f;它能做什么&#xff1f;我们来问下ChatGPT Zotero是一款开源的、免费的文献管理工具。它旨在帮助研究人员、学生和学术界的人们更好地管理和组织他们的研究文献、引用和参考资料。 Zotero 支持Windows、MacOS、Linux、iOS等多个…

GLM-130B-一个开放的双语通用预训练模型-论文精读

本文为作为类ChatGPT的模型ChatGLM的前期基础论文2《AN OPEN BILINGUAL PRE-TRAINED MODEL》的精读笔记&#xff0c;基础论文1的精读笔记请见《GLM论文精读-自回归填空的通用语言模型》。希望对大家有帮助&#xff0c;欢迎讨论交流。GLM-130B&#xff0c;主要思想概述&#xff…

【跟李牧学AI】 ChatGPT是什么?--先看看InstructGPT

最近OpenAI公司的ChatGPT非常火爆&#xff0c;虽然正式的论文还没有发布&#xff0c;但是按照OpenAI一贯的工作思路&#xff0c;基于前期工作进行相应的改造&#xff0c;我们可以跟着沐神一起来看看InstructGPT&#xff0c;也算法对了解ChatGPT有个前期的知识储备。 instructG…

李沐论文精度系列之十:GPT-4

文章目录 一、AIGC资讯速览1.1 Toolformer&#xff08;2023.2.9&#xff09;1.2 ChatGPT plugin1.3 LLaMA&#xff08;2023.2.24&#xff09;1.4 Visual ChatGPT&#xff08;2023.3.8&#xff09;1.5 GigaGAN&#xff08;2023.3.9&#xff09;1.6 Stanford Alpaca&#xff08;2…

ViT论文逐段精读【论文精读】-跟李沐学AI

视频链接&#xff1a;ViT论文逐段精读【论文精读】_哔哩哔哩_bilibili ViT&#xff1a;过去一年&#xff0c;CV 最有影响力的工作 推翻了 2012 Alexnet 提出的 CNN 在 CV 的统治地位 有足够多的预训练数据&#xff0c;NLP 的 Transformer 搬运到 CV&#xff0c;效果很好 打…

血条加载!百度地图上线复苏指数;Quora推出问答机器人;腾讯绝悟成功用于医疗诊断;使用chatGPT生成推文;GitHub AI项目精选 | ShowMeAI资讯日报

&#x1f440;日报合辑 | &#x1f3a1;AI应用与工具大全 | &#x1f514;公众号资料下载 | &#x1f369;韩信子 &#x1f4e2; 『百度地图 复苏指数』用大数据吹起人间烟火 随着疫情防控措施的调整优化&#xff0c;市民的出行和消费需求逐步回暖&#xff0c;各大城市日渐复…

火爆全网的[ChatGPT] ai studio可以玩啦

☆ 只需两步&#xff0c; Ai Studio上也可以玩[ChatGPT]了 ☆ 无需账号即可体验喽~ 【一定要选择最新版本的项目嗷&#xff01;官方接口更新太快&#xff01;】 据说诱导式可以得到匪夷所思的结果&#xff01; 图源网络&#xff0c;仅供娱乐 0 Fork后进入项目 应用中心体验…

终于来了,OpenAI发布iOS版ChatGPT,支持语音提问

OpenAI发布了ChatGPT的iPhone版本&#xff0c;并承诺未来将发布安卓版本。 该软件免费使用&#xff0c;目前仅支持英语&#xff0c;在美国可以通过苹果商店下载后&#xff0c;在iOS操作系统的设备上使用&#xff0c;用户可以输入问题并接收来自聊天机器人(16.310, -0.34, -2.0…