要做中国OpenAI的很多,但智源要打造大模型领域的Linux

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

“要做中国的OpenAI!”“要打造中国版ChatGPT!”ChatGPT的火以燎原之势蔓延到每一个角落。

人们目光的焦点聚集到这个具体的现象级应用,或者其它大模型支撑的类ChatGPT产品上。大模型似乎成为了人人都能参与的游戏?智源研究院院长黄铁军并不这样想。

ChatGPT的出现,好比用电灯点亮了一个街区。
但是要建全国、全球的电网,中间还有很长的路要走。

“很长的路”上,技术、资金、算力、算法、基础设施,搭建了一道难以攻破的壁垒。要继续前行,得凿开壁垒,开凿的斧头应是大量的技术研究和创新合作。

智源研究院就提供了这么一把斧头,它联合30多家产学研单位,开发了FlagOpen(飞智)大模型技术开源体系。这也是国内首个大模型开源体系。

c573e3a4662e99f7038d85d78cc95311.png黄铁军

黄铁军表示,希望大家的关注点从AI“海平面以上”冰山一角的大模型,回归到“海平面以下”的AI技术生态的全部,尤其是技术体系上。

一枝独秀,不如降低AI的应用门槛

2022年的云栖大会上,阿里推出了AI大模型开源社区“魔搭”Model Scope,推出伊始,达摩院就向社区贡献了300余个AI模型,全面开源开放。

FlagOpen是否意味着又一个魔搭的诞生?智源研究院副院长兼总工程师林咏华解释了二者的不同。

“魔搭有点像抱抱脸(HuggingFace)”林咏华谈道,“FlagOpen和魔搭不一样的地方是,我们的主要目标不是构建一个聚集很多人的繁华社区,而是推动大模型技术的发展。”

基于这个目标,FlagOpen配套了六个模块,分别是FlagAI、FlagPerf、FlagEval、FlagData、FlagStudio和FlagBoot。

f9ffe0ac2c49f341b1e59caae87b9a5e.png

FlagAI

FlageAI集成了很多主流大模型算法技术,以及多种大模型并行处理和训练加速技术,并支持微调。目前涵盖的模型包括NLP、CV与多模态等领域,如语言大模型OPT、T5,视觉大模型ViT、Swin Transformer,多模态大模型CLIP等。目前,FlagAI已经加入Linux基金会

“悟道2.0”通用语言大模型GLM,“悟道3.0”视觉与训练大模型EVA,视觉通用多任务模型Painter,文生图大模型AltDiffusion(多语言),文图表征预训练大模型(多语言)等智源研究院“悟道”大模型项目多个成果也开源在FlagAI。

FlagPerf

AI软硬件评测面临异构程度高、兼容性差、应用场景复杂多变的挑战。FlagPerf搭建的AI硬件评测体系,支持多种深度学习框架,及时跟进最新主流模型评测需求,便于AI芯片厂商插入底层支撑工具,且不以排名为核心目标

截至FlagOpen体系发布,FlagPerf已和天数智芯、百度PaddlePaddle、昆仑芯科技、中国移动等进行合作。

FlagEval

FlagEval是覆盖多个模态领域、包含评测维度的评测工具,首先开放的是近期很火的多模态领域-CLIP系列模型评测工具,支持多语言多任务、开箱即用。

FlagData

FlagData数据工具开源项目集成包含清洗、标注、压缩、统计分析等功能在内的多个数据处理工具与算法。此前,智源研究院已经构建了WuDaoCorpora语料库。

FlagStudio

FlagStudio是文生图、文生音乐等艺术创作相关的开源项目集合,集合的算法和模型更贴合中文场景,当前主要提供智源研究院文生图相关能力的应用。

FlagBoot

FlagBoot是基于Scala开发的轻量级高并发微服务框架,默认完全异步,且没有宏、隐式转换等晦涩难懂的代码。极少的代码量便于开发者轻易了解背后逻辑,而后进行自定义修改。

“大数据+大算力+强算法=大模型”是当前AI发展的主流,用FlagOpen,开发者尤其是初创公司,可以尝试大模型的开发和研究工作,换句话说,AI的研发、应用门槛被降低了。

以大模型为主导的方向提供基础开源体系,某种意义上,智源研究院在追赶ChatGPT产品的热点上退了一步。这或许是其非营利性机构的性质使然。

而ChatGPT背后的OpenAI,也是打着非营利性机构的旗号出道的(2019年3月1日,OpenAI LP子公司成立,旨在营利)。同样的机构性质,同样押注AI,并关注大模型赛道,

5c1a468bd66815908cf8fd54e7312819.png

智源研究院有打算,或者可能成为中国的OpenAI吗?

ChatGPT每日调动后台参数的成本已经是天文数字。如果要在中国打造一个OpenAI,需要多少成本打底?

“智源要不要做一个OpenAI,很难简单做对比。”黄铁军回答这个问题时说道,DeepMind、OpenAI和智源研究院是同类机构,但不能简单等同。追求AI前沿,做开放研究是三家机构的共鸣;没有大量投资就没有那么多人做大量探索,三个机构也都有各自的社会资源投入办法,比如微软刚追投了OpenAI100亿美元。

但黄铁军同时表达了自己的不解,那就是:中国版的OpenAI怎么定义?

“某种意义上,这就是很不清楚的问题。”

我没有批评的意思。但是有人站出来说要做中国的OpenAI,他到底是什么意思?是想和OpenAI一样有100倍的盈利吗?更多的还是要问想做中国OpenAI机构那个人,他眼中的定义是什么。

至于做出OpenAI的必要成本投入,黄铁军给出的答案是“很难估计”,并表示,投资不是他本人也不是智源研究院关心的问题。

开源的打不过封闭的?

PC时代,Linux打破Wintel联盟的垄断;在iOS的封闭生态和Android的准封闭生态下,开源的RISC-V异军突起。开源意味着开放,意味着多家机构同时维护带来的风险降低和问题减少。

FlagOpen是国内首个大模型开源体系,智源研究院拿出了这样的态度:

大模型时代,需要这样的开源。智能时代需要真开源,就像Linux、RISC-V和2022年完全转入开源社区的PyTorch。

聊到此处,林咏华表示更愿意把FlagOpen类比为大模型领域的Linux

750728180995485f2e0b0ea3dbd8885f.jpeg

但有一种说法广为流传,即开源虽好,能让得到更好的迭代和更新,但开源的打不过封闭的

对这个问题,黄铁军做出了回应。他称Linux的成功,不是因为把其它操作系统都打败了,而是在整个市场竞争中占据了主要份额。

开源开放应该是一个大趋势,大部分情况下,以开源形式或以开源形式为基础的产品会占据较大的份额。


与此同时,在某一特定方向上,有一个闭源产品做得更好并不奇怪。这不等于谁打败了谁,而是大家在满足用户需求时做出了不同选择。

开源是FlagOpen的选择,来一起看看这个选择现阶段的成果——

登陆GitHub可以看到FlagOpen体系里各个项目的标星,星最多的是FlagAI,尚不过千,最少的标星量只有几十。另外还可以观察发现,开源体系中只涉及推理方面,没有涵盖训练部分。

cfdba6d1ca5a433b76c184fa87826e31.png

林咏华表示这是智源的策略,即不是等做到完美再开源,而是把种子点做了之后就开源,以此方便各个企业之间在没有商业合作协议的情况下就能互相合作。

选择现在公布FlagOpen开源体系的另一个原因,是现在大模型火上了天,有很多没有接触过大模型的初创团队也开始尝试自己训模型。

工欲善其事,必先利其器,“既然有这么多人想做这件事,我们在这个时候开源出来,是想给予我们的经验,让他们更加顺利往前走。”

「中国AIGC产业峰会」启动

邀您共襄盛举

「中国AIGC产业峰会」即将在今年3月举办,峰会将邀请AIGC产业相关领域的专家学者,共同探讨生成新世界的过去、现在和未来。

峰会上还将发布《中国AIGC产业全景报告暨AIGC 50》,全面立体描绘我国当前AIGC产业的竞争力图谱。点击链接或下方图片查看大会详情:

寻找中国版ChatGPT,量子位邀你共同参与中国AIGC产业峰会

71a16c999db56445c2942803c920c9a8.gif

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/35378.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

通过配置不当的微软app劫持Bing 搜索结果,获得4万美元漏洞奖励

聚焦源代码安全,网罗国内外最新资讯! 编译:代码卫士 一款配置不当的微软应用可使任何人登录并实时修改 Bing.com 搜索结果以及注入 XSS 攻击,攻陷 Office 365 用户的账号。 Wiz公司的研究人员发现了该问题并将其描述为“BingBang”…

解读ChatGPT背后的技术重点:RLHF、IFT、CoT、红蓝对抗

近段时间,ChatGPT 横空出世并获得巨大成功,使得 RLHF、SFT、IFT、CoT 等这些晦涩的缩写开始出现在普罗大众的讨论中。这些晦涩的首字母缩略词究竟是什么意思?为什么它们如此重要?我们调查了相关的所有重要论文,以对这些…

谷歌优化扩散模型!在三星手机上运行Stable Diffusion,12秒内出图!

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【扩散模型】微信技术交流群 转载自:机器之心 | 编辑:陈萍、小舟 Speed Is All You Need:谷歌提出针对 Stable Diffusion 一些优化建议&am…

再次加入OpenAI,特斯拉前AI总监Andrej Karpathy刚刚官宣!

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>CV微信技术交流群 转载自:机器之心 官宣回归OpenAI,特斯拉前AI高级总监Andrej Karpathy的下家定了。 刚刚,特斯拉前 AI 高级总监 Andrej K…

行业前沿 | 畅想AIGC技术研究与应用实践(一)

AIGC的火热之势已经蔓延到各行各业,技术浪潮冲击下,关于AIGC创业、AIGC未来发展方向以及AIGC的应用实践等,企业、投资者以及技术产品专家们有着不一样的思考。 近日,数美科技联合AMD举办的AIGC沙龙活动,邀请了经纬创投…

用GPT-4一天赚440元/ PyTorch2.0稳定版正式发布/ 谷歌眼镜彻底告别舞台…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 嗯咳咳~今天是3月16日星期()。 V我50(Doge)带你看看科技圈都发生了哪些大事。 周鸿祎:GPT要消灭人类 周鸿祎又语出惊人!前脚GPT-4刚刚发布&#xff0…

互动福利|免费试用阿里云端TuGraph图数据库,还有GoPro、filco键盘、苹果HomePod mini等你拿!...

想要对数据关系进行 更好的数据可视化? 更高效的数据处理? 更精准的数据分析? 更快的查询速度? 来试试图数据库吧! 为鼓励更多用户探索应用图数据库,TuGraph联合阿里云计算巢,开放限量免费…

用AI给娃定制绘本 #麻瓜+AI混合工作流试验 9

这次试着用AI给娃定制一本绘本,目的是解决一个问题——娃很喜欢国际象棋,但在下棋的时候又很怕输……过程中尽量少人工参与,先看半成品,再说工作流。 这个画风,有点像娃喜欢的《工作细胞》。 主要流程 第一步&#xff…

AI制作有声绘本《小马历险记》

最近,我正在准备一堂给家长AI的课程,其中有一节专门介绍如何利用AI帮助孩子养成良好的习惯。为了帮助我的女儿改掉拖延的习惯,我借助AI制作了一本绘本,名为《小马历险记》,并为它配上了音乐和主题歌。请大家欣赏一下这…

为什么要学习研究 ChatGPT 等新一代 AI 技术

我最近一直在研究 ChatGPT,包括注册账号,试用聊天功能等。 其实 2022 年 11 月 ChatGPT 发布以来,我一直是个旁观者,看到好多文章和网友讨论这款 AI 大语言模型驱动的聊天应用,却没有使用和进一步了解它。直到最近我突…

chatGPT+Midjourney制作绘画本

chatGPTMidjourney制作绘画本 灵感来源:https://www.bilibili.com/video/BV1N24y1F7ga/?spm_id_from888.80997.embed_other.whitelist&vd_source6dd97671c42eb7cf111063714216bd0b 最终效果: 绘本故事 故事塑造能力弱的人可以使用chatGPT来帮助编…

01.自动化办公的准备工作(免费指导,只需三步)

两步准备,一步到位! 智动办公 在开始自动化办公前,有一些准备工作是必须先完成的,比如程序运行环境的搭建,百度AIP的本地安装等。听着很玄乎,其实操作起来很简单,照着我的详细步骤来就没错了&a…

not available in your country

解决OpenAIs API is not available in your country. 使用教程 链接: 链接 使用教程 1.点击连接后注册并登录,点击用户中心,下滑找到一下界面。并根据步骤,下载软件并运行之后一键导入配置。 2. 之后点击软件左侧 3.点击主页,将…

Overleaf编写试验报告初体验

昨天刚刚体验了用Markdown文本编辑器编写一个实验心得,但对于要提交实验报告的我来讲还远远不够,于是我请教了我们班的学委,得知了一款常用的编写学术文章的程序--Overleaf 网址:https://www.overleaf.com/ 你可以使用谷歌账号登录…

markdown学习

m a r k d o w n 学习 \mathbf{{\Huge markdown学习}} markdown学习 一、markdown简介[1] 转换:markdown编写的文档导出HTML、Word、Latex、PDF等文档 后缀:.md或.markdown 用途:撰写电子书,例如GitHub、CSDN、简书、reddit、Dia…

SSM+微信小程序+VUE项目实战:商城系统

实训时小组写的一个项目,有2个使用端,用户端是微信小程序,后台管理端是vue写的网页,后端统一是一个项目SpringSpringMVCMybatis。 文章目录 项目仓库项目截图需求描述功能分析开发环境数据库设计小程序页面后端难点技术选型 管理端…

记爬虫一个网站图片,反反爬虫破解一个图片加密算法

目录 一、初遇拦路虎 二、破解加密 1、详细分析 2、分析js代码 三、转化为python爬虫代码 四、全部代码 心血来潮想玩下最近比较火的AI绘画,于是想要搞点图片丢到模型上训练 一、初遇拦路虎 随便找个外国的图片网站来爬点图片,随手f12打开、检视…

鸿蒙系统文件删除怎么恢复,鸿蒙系统升级后会删除东西吗?鸿蒙系统游戏数据互通吗?...

鸿蒙系统无疑是这段时间最大的热点了,也因为太过于火爆,花粉俱乐部已经在维护修理了,不过很多小伙伴还在担忧鸿蒙系统游戏和安卓系统通用吗?鸿蒙系统升级后会丢失数据吗?下面一起来看看升级鸿蒙系统的注意事项。 鸿蒙系…

华为鸿蒙系统HarmonyOS学习之七:鸿蒙Harmony给IoT带来新的契机

华为鸿蒙系统HarmonyOS学习之七:鸿蒙Harmony给IoT带来新的契机 一、物联网将带来生产生活方式的变革 物联网是新一代信息技术的高度集成和综合运用,对产业变革和经济社会绿色、智能、可持续发展具有重要意义。 自从国家把物联网列入重点发展领域以来…

HarmonyOS系统内核中GPIO控制方法

大家好,今天主要和大家聊一聊,如何使用鸿蒙系统控制开发板去点亮LED灯。 目录 第一:鸿蒙外设GPIO简介 第二:鸿蒙外设接口说明 GPIO使用流程图: ​编辑 第三:鸿蒙系统中API分析 第四:硬件设计…