文丨谭婧
以ChatGPT为代表的AI大模型是2023年的科技C位。
2023年3月27日,ChatGPT引发的“抓马连续剧”,又有新剧更新。
前情提要:
前美团联合创始人、高级副总裁王慧文发文宣布进入AI领域,称将打造中国的OpenAI。
新闻标题一:《王慧文放话:我先投3个亿》
当然,他现在的身份是美团非执董,北京光年之外科技有限公司股东、执董。
随后,王兴在朋友圈中表示:“……既然他决心拥抱这次大浪潮,那我必须支持。”
新闻标题二:《王兴将个人参与王慧文“光年之外”A轮投资并出任董事》
据王慧文透露,公司75%的股份用于邀请顶级研发人员。
“邀请顶级研发人员”一语亮了,值得留意。
前后脚,王慧文在帖子上说:“目前已确认三个联合创始人,一个Infra背景的联创,一个算法背景的联创,和我。”
“一个Infra(基础设施)背景的联创”这个词又亮了,这个背景的联创应在我视线范围之内。
终于,2023年3月27日,“亲爱的数据”独家获悉,前美团联合创始人王慧文团队“正在”收购国产AI框架OneFlow。
要有一场重要的会议讨论“收购事宜”,不清楚会议召开的具体时间。
这时候不用联系参加会议的任何人了,按照要求,谁也不能说交易条款的事。
鉴于发稿时间就在此事件的进展过程之中,故而无法获悉OneFlow公司的收购金额。
新闻标题三:《独家丨前美团联合创始人王慧文“正在”收购国产AI框架OneFlow,光年之外欲添新大将》
图为:一流科技创始人袁进辉
“亲爱的数据”过往相关人物文章:
史上最大,人工智能算法模型GPT-3问世,这意味着什么?
电影《失控玩家》:软件2.0,让游戏角色“觉醒”了?
简短版的介绍是:
袁进辉(老师木),2008年7月自清华大学计算机系获得工学博士学位,获得清华大学优秀博士学位论文奖,2013年加入微软亚洲研究院从事大规模机器学习平台的研发工作。
2015年至2016年底,专注于搭建基于异构集群的深度学习平台,项目荣获微软亚洲研究院院长特别奖 (top 1%)。2017年创立北京一流科技有限公司,致力于打造分布式深度学习平台。
2021年2月,一流科技由高瓴创投独家领投A轮,融资总额5000万元人民币。
关于袁进辉博士是谁,以及OneFlow是一家什么样的公司的故事,那就请看这篇文章吧。
搞深度学习框架的那帮人,不是疯子,就是骗子(可点击)
虽然文章完稿于2021年春节,但是文中的故事并未过时。
全剧终。
One More Thing
我和AI大模型的缘分,要从2021年元宵节发布的一篇1.4万字的稿子谈起。
《搞深度学习框架的那帮人,不是疯子,就是骗子》这篇稿子发布后,遭遇了冰火两重天,号称见不多识不广的谭老师我,直接傻眼了。
一方面文章在AI领域、计算机领域百余位专家的朋友圈疯传,我的微信那几天是爆炸状态。
有很多认识的人,疯狂地给我发截图。告诉我这篇文章是如何在他们的朋友圈疯传。
一时间,我变成了一个朋友圈截图收集器,哇塞好开心。
我看到很多知名人士的转发记录,以及知名人士的群聊记录。虽未结识,但久仰大名矣。
随后不久,一位叫做谢育涛的专家致电我,他告诉我,沈向洋老师想让他代为转达,问我愿不愿意加入IDEA,主要工作是写稿。
IDEA研究院就是鼎鼎大名的粤港澳大湾区数字经济研究院。
谭老师实在水平有限。
虽然这篇文章登上了知乎的周热点,但是评论区翻车了。
好一片挖苦讽刺谩骂嘲讽之声。我当时心想,一个人一定是干了什么丧尽天良的事,才配获此“殊荣”。
甚至有人说,你不配写科技,你一个女的为什么不去写情感专栏。
哇,这真是一个好建议,我怎么没有想到。
言归正传,难能可贵的百余位专家转发,与知乎网友留言难听的冰火之别说明了什么?
很有可能说明吃瓜群众对于人工智能系统的认知和真正的专家相比,其分裂程度可能比东非大裂谷还大。
话说回来,世界顶级大型计算机系统令顶尖架构师和开发者头疼,难道写这玩意的故事的人就不头疼了吗?
做难事必有所得,头疼显然是值得的。
因为这篇文章,很多知名专家来加微信,和我聊天。一些之前写稿攒下的专家资源,也愿意把我推荐给“顶尖专家”。
求之不得,感激不尽。
一个月后,也就是2021年3月,我在杭州阿里巴巴,见到了一位叫做杨红霞的顶级人工智能专家。
看见名字里的“红”字不要怀疑,没错,女科学家。
那是一个春光明媚的晴天,湖蓝色玻璃映衬着阿里巴巴特有的橙色装饰,像跳动的钢琴键。
远远望见超大的“淘公仔”站在建筑物外墙上咧着嘴笑。
杨红霞博士朝我招手,我顺着半圆形的斜坡步行而上,也向她挥手回应。春草茵茵,行李箱轱辘哗哗作响。
那次,我们聊的是一款叫做M6的AI大模型。
丨杨红霞博士拍摄的本文作者,哈哈哈……
那天,我们也畅谈了当时最火的AI大模型GPT-3。
GPT-3在2020年6月10日发布,给中国玩家的触动很大。更直白些,中国AI科学家有压力。
阿里的会议室多得像森林里的树木,终于坐下,一张桌子,两杯咖啡。
杨红霞博士扎着利落的马尾,额前干净,没有刘海,少量碎发。
她说起话来,爽爽快快,普通话极为流利标准。
她告诉我:“我实话跟你说,为什么会回国?”
她的答案真好,连标点符号里都流露出温柔的真诚与强烈的技术愿景。
“我最喜欢的技术是从复杂的业务里抽象出来,用技术去解决实际问题。我不喜欢走反过来的路,假如走反过来的路,我可以选择去研究型的高校。”
“所有人都要有一些耐心,没有耐心,永远只有单点的结果,很难去实现线和面。”
当天的独家专访的主要内容有以下几点:
第一,如今的深度学习的模型已经不能满足我们的更多要求了。因为说白了可能这个算法模型刚出现的时候只能满足一些特别low(低)的要求,慢慢地,我们会越来越接近通用人工智能,要求的高度肯定是越来越高的。
第二,阿里巴巴希望在一些很重要的核心方向上,尤其是在支撑人工智能的下一个阶段的技术和产品上,可以做到世界领先。
第三,其他技术细节。
我就不写技术细节了,如果写了,按照谭老师做事的规矩,要先拿给该司负责这方面的同学审核才能出稿,我不写,也就免了。
可以看出,阿里巴巴很早就认得清下一代人工智能的价值,他们也很早出发了。
谈话的最后,杨红霞博士请我品尝了阿里巴巴食堂的鸭血粉丝汤,挺好吃的。
夜幕降临淘宝城,我明白了中国的AI科学家们在思考:在下一代人工智能的浪潮当中,中国到底哪些技术可以作为世界第一?
在与杨红霞博士面谈之后,我又和几位技术大佬聊过。
贾扬清,林伟(原微软亚洲研究院研究员,原微软硅谷研究院研究员,阿里云机器学习PAI平台负责人),曹政。
他们分别代表的是三层不同的内容:框架,平台,云基础设施。再算上杨红霞的模型算法团队。
一个AI大模型汇集了如此多的大佬。
可以看出,对于AI大模型,阿里投入的是整建制的团队,调动的不只是达摩院的力量。
所以,才会有M6大模型的问世。
这基本上是互联网公司制造大模型的标准打法,多个团队“共建”一个模型。
前后与多位专家多次长聊之后,我清楚地理解到,想做出超级AI大模型(那时候还没有ChatGPT),仅靠一支算法团队远远不够。
大模型团队是由几支分别擅长于不同领域(AI算力,AI框架,AI平台)的技术团队合力而成。
因为一些外力,我和杨红霞博士的故事就在这里戛然而止了,那次采访没有出稿。
2023年春节前后,我得知杨红霞博士已经去了今日头条。此后,所有人问起我关于她离职的消息,我都三缄其口。
我们聊回ChatGPT这类AI大模型。这么重要的特大工程,底层能不重要吗?
需要解释一下,在互联网大厂,底层是共用的。阿里巴巴如此,华为,腾讯,皆如此。
OneFlow的独特之处在于,这支团队挑了一个大厂云集的赛道,看上去不是去战斗,更像是去“送死”。
这是一个“置之死地,方可后生”的故事。我很激动地见证了这个故事“讲述”到今天。
在ChatGPT爆发之际,人才尤为可贵,“购买”独立团队比“挖”互联网大厂整建制的团队好操作,这也是收购可能发生的原因之一,就看袁进辉博士和光年之外谈判的价格了。
回到ChatGTP,AI算力、AI框架、AI平台、AI模型合力创造了AI大模型的成功。
当然,ChatGPT有模型层面的“独家秘方”。
为什么我一直在反复强调合力?
大家都看到了,ChatGPT和GPT-4的成功“另有高明”。
ChatGPT不是孤胆英雄的成功,而是科技巨头和通用人工智能狂人的合作,一个巨大,一个微小。
说白了,巨头微软再成功,能力再强,也没有仅凭一己之力搞定ChatGPT 。
好在,微软有眼光。OpenAI有股权结构和公司治理的神奇想法。
于是,强强联合成功。
于是,新模式成功。
同时,“亲爱的数据”获悉,中国“名列前茅”的某科技巨头已经和多支非互联网AI大模型团队见面。
其谈判策略就是:“我”作美国微软,“你”作美国OpenAI。这个策略可真好,看懂掌声。
稍微插一句,有的大厂布局了不仅仅一个GPT类型的大模型。当然,这又是另一个故事了。
总而言之,中国的大模型团队分为两种:互联网和非互联网团队。
非互联网团队包括:
前美团联合创始人王慧文团队,中科院自动化所紫东太初团队,清华系智谱华章团队,杭州的西湖心辰团队,北京的智源研究院团队,李开复的Project AI 2.0团队。
这个名单的长度还会增加,因为我看到有些投资人已经“急不可耐”了。
某AI大佬曾谈到:
“观察硬件和算力平台,如果没有某国的捣乱,整体而言,我们的硬件计算能力,计算量,以及就是说我们的一些底层的核心技术,比如说像高性能网络、高性能存储、异构计算等等。在国际上,大家的能力拉平,大同小异,更多是在强调怎么样用好这些资源。”
如今基建扎实支撑,ChatGPT这个“庞然大物”横空出世。
如今OneFlow也被知名大模型团队收购了,足见其意义。
AI新基建的范畴在变大。
一开始,GPT系列大模型不是基建。
2023年,GPT-4大模型现在已经是新基建的一部分了。
在ChatGPT引领的这一产品架构下,终端应用和底层大模型的联动十分紧密。
今天看来,AI大模型是电,我们要有自己的发电厂。
九章云极创始人方磊说:“AI大模型是电,可发电厂并不是垄断的。可以大家都盖一些发电厂。”
接下来,无论是大玩意,还是小玩意,我们把大模型玩起来,耍起来,在应用层面发展起来。
这句话不是我提的,巧了,很多AI大佬都和我说过同一句话。哪怕不是超级应用,哪怕只是做一个好用的小东西,用起来才是重要,流行起来更是王道。
接下来,就看各路大神们先如何打破ChatGPT天花板,接着再怎么做出超级应用。
啰嗦了这许多。最后我只想说,恭喜袁进辉博士,恭喜OneFlow团队。
我特别想对袁老师说:“请原谅我在股东大会还没有开完,协议还没有签下的时候就发稿。”
(这也是文章标题《前美团高管王慧文“正在”收购国产AI框架OneFlow,光年之外新联创袁进辉就位》中,“正在”一词的由来。)
都不容易,相互体谅,理解万岁。
有人在读者群问我:“中国AI大模型四小龙会是谁?”
提出这个问题的朋友的思维还停留在上一轮AI热潮。
某种意义上,AI大模型的奇点已过。
我的答案是:有可能中国AI大模型不会有四小龙,但会有多个团队争夺大模型的高地。
万一追不上怎么办?那很有可能,一家独大,大家全挂。
换句话说,我的观点是,假如美国OpenAI公司和微软公司赢家通吃,这里的赢家只有一家(一对),那会发生什么样的事情?
这样的话,可能很大一堆产业都最多成为依附在巨头API上的服务商。
这可太糟了。
好消息是,先进技术领先的时间窗口非常短暂。
坏消息是,“赢家”的布局超级迅猛。
这也反映出他们自知领先时间并不是那么多,也有很强的危机感。
中国AI大模型创业者们在焦虑中临机制变。
昔日我笔下的“骗子”已不知去向,而“疯子”在太阳升起的地方,沐浴着金色而悠远的晨光,再次出发,留给地平线崭新的背影。
有机会见证历史一刻,可真激动……
(完)
更多阅读
AI框架系列:
1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)
2.搞AI框架那帮人丨燎原火,贾扬清(二)
3.搞 AI 框架那群人(四):AI 框架前传,大数据系统 往事
4.搞 AI 框架的那群人(三):狂热的 AlphaFold 和沉默 的中国科学家
注:(三)和(四)现在并未公开发表,将会以图书出版的形式与各位见面。
漫画系列
1. 解读硅谷风投A16Z“50强”数据公司榜单
2. AI算法是兄弟,AI运维不是兄弟吗?
3. 大数据的社交牛逼症是怎么得的?
4. AI for Science这事,到底“科学不科学”?
5. 想帮数学家,AI算老几?
6. 给王心凌打Call的,原来是神奇的智能湖仓
7. 原来,知识图谱是“找关系”的摇钱树?
8. 为什么图计算能正面硬刚黑色产业薅羊毛?
9. AutoML:攒钱买个“调参侠机器人”?
10. AutoML:你爱吃的火锅底料,是机器人自动进货
11. 强化学习:人工智能下象棋,走一步,能看几步?
12. 时序数据库:好险,差一点没挤进工业制造的高端局
13. 主动学习:人工智能居然被PUA了?
14. 云计算Serverless:一支穿云箭,千军万马来相见
15. 数据中心网络:数据还有5纳秒抵达战场
16. 数据中心网络“卷”AI:迟到不可怕,可怕的是别人都没迟到
17. ChatGPT大火,如何成立一家AIGC公司,然后搞钱?
18. ChatGPT:绝不欺负文科生
19.从大神Alex Smola与李沐离职AWS创业融资顺利,回看ChatGPT大模型时代“底层武器”演进
20. ChatGPT触类旁通的学习能力如何而来?
DPU芯片系列:
1. 造DPU芯片,如梦幻泡影?丨虚构短篇小说
2. 永远不要投资DPU?
3. DPU加持下的阿里云如何做加密计算?
4. 哎呦CPU,您可别累着,兄弟CIPU在云上帮把手
长文系列:
1. 我怀疑京东神秘部门Y,悟出智能供应链真相了
2. 超级计算机与人工智能:大国超算,无人领航
最后,再介绍一下主编自己吧,
我是谭婧,科技和科普题材作者。
为了在时代中发现故事,
我围追科技大神,堵截科技公司。
偶尔写小说,画漫画。
生命短暂,不走捷径。
个人微信:18611208992
原创不易,多谢转发
还想看我的文章,就关注“亲爱的数据”。