独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow,光年之外欲添新大将...

文丨谭婧

以ChatGPT为代表的AI大模型是2023年的科技C位。

2023年3月27日,ChatGPT引发的“抓马连续剧”,又有新剧更新。

前情提要:

前美团联合创始人、高级副总裁王慧文发文宣布进入AI领域,称将打造中国的OpenAI。

新闻标题一:《王慧文放话:我先投3个亿》

当然,他现在的身份是美团非执董,北京光年之外科技有限公司股东、执董。

随后,王兴在朋友圈中表示:“……既然他决心拥抱这次大浪潮,那我必须支持。”

新闻标题二:《王兴将个人参与王慧文“光年之外”A轮投资并出任董事》

据王慧文透露,公司75%的股份用于邀请顶级研发人员。

“邀请顶级研发人员”一语亮了,值得留意。

前后脚,王慧文在帖子上说:“目前已确认三个联合创始人,一个Infra背景的联创,一个算法背景的联创,和我。”

“一个Infra(基础设施)背景的联创”这个词又亮了,这个背景的联创应在我视线范围之内。

终于,2023年3月27日,“亲爱的数据”独家获悉,前美团联合创始人王慧文团队“正在”收购国产AI框架OneFlow。

74887ce8761270e45e0189ca5b0e3fcd.jpeg

17967e8c6960718c1e58554f24129336.png

要有一场重要的会议讨论“收购事宜”,不清楚会议召开的具体时间。

这时候不用联系参加会议的任何人了,按照要求,谁也不能说交易条款的事。

鉴于发稿时间就在此事件的进展过程之中,故而无法获悉OneFlow公司的收购金额。

新闻标题三:《独家丨前美团联合创始人王慧文“正在”收购国产AI框架OneFlow,光年之外欲添新大将》

7e230ab2235b3dbaed619edf50e02fcf.jpeg

图为:一流科技创始人袁进辉

“亲爱的数据”过往相关人物文章:

史上最大,人工智能算法模型GPT-3问世,这意味着什么?

电影《失控玩家》:软件2.0,让游戏角色“觉醒”了?

(可点击文章标题进入阅读)

简短版的介绍是:

袁进辉(老师木),2008年7月自清华大学计算机系获得工学博士学位,获得清华大学优秀博士学位论文奖,2013年加入微软亚洲研究院从事大规模机器学习平台的研发工作。

2015年至2016年底,专注于搭建基于异构集群的深度学习平台,项目荣获微软亚洲研究院院长特别奖 (top 1%)。2017年创立北京一流科技有限公司,致力于打造分布式深度学习平台。

2021年2月,一流科技由高瓴创投独家领投A轮,融资总额5000万元人民币。

关于袁进辉博士是谁,以及OneFlow是一家什么样的公司的故事,那就请看这篇文章吧。

搞深度学习框架的那帮人,不是疯子,就是骗子(可点击)

虽然文章完稿于2021年春节,但是文中的故事并未过时。

全剧终。

One More Thing

5c117778cb9f63b784cc84828ff89feb.jpeg

我和AI大模型的缘分,要从2021年元宵节发布的一篇1.4万字的稿子谈起。

《搞深度学习框架的那帮人,不是疯子,就是骗子》这篇稿子发布后,遭遇了冰火两重天,号称见不多识不广的谭老师我,直接傻眼了。

一方面文章在AI领域、计算机领域百余位专家的朋友圈疯传,我的微信那几天是爆炸状态。

有很多认识的人,疯狂地给我发截图。告诉我这篇文章是如何在他们的朋友圈疯传。

一时间,我变成了一个朋友圈截图收集器,哇塞好开心。

我看到很多知名人士的转发记录,以及知名人士的群聊记录。虽未结识,但久仰大名矣。

随后不久,一位叫做谢育涛的专家致电我,他告诉我,沈向洋老师想让他代为转达,问我愿不愿意加入IDEA,主要工作是写稿。

IDEA研究院就是鼎鼎大名的粤港澳大湾区数字经济研究院。

谭老师实在水平有限。

虽然这篇文章登上了知乎的周热点,但是评论区翻车了。

好一片挖苦讽刺谩骂嘲讽之声。我当时心想,一个人一定是干了什么丧尽天良的事,才配获此“殊荣”。

甚至有人说,你不配写科技,你一个女的为什么不去写情感专栏。

哇,这真是一个好建议,我怎么没有想到。

言归正传,难能可贵的百余位专家转发,与知乎网友留言难听的冰火之别说明了什么?

很有可能说明吃瓜群众对于人工智能系统的认知和真正的专家相比,其分裂程度可能比东非大裂谷还大。

话说回来,世界顶级大型计算机系统令顶尖架构师和开发者头疼,难道写这玩意的故事的人就不头疼了吗?

做难事必有所得,头疼显然是值得的。

因为这篇文章,很多知名专家来加微信,和我聊天。一些之前写稿攒下的专家资源,也愿意把我推荐给“顶尖专家”。

求之不得,感激不尽。

一个月后,也就是2021年3月,我在杭州阿里巴巴,见到了一位叫做杨红霞的顶级人工智能专家。

看见名字里的“红”字不要怀疑,没错,女科学家。

那是一个春光明媚的晴天,湖蓝色玻璃映衬着阿里巴巴特有的橙色装饰,像跳动的钢琴键。

远远望见超大的“淘公仔”站在建筑物外墙上咧着嘴笑。

杨红霞博士朝我招手,我顺着半圆形的斜坡步行而上,也向她挥手回应。春草茵茵,行李箱轱辘哗哗作响。

那次,我们聊的是一款叫做M6的AI大模型。

8b60781fa585bcfe57cd87b26ed0513a.jpeg

丨杨红霞博士拍摄的本文作者,哈哈哈……

那天,我们也畅谈了当时最火的AI大模型GPT-3。

GPT-3在2020年6月10日发布,给中国玩家的触动很大。更直白些,中国AI科学家有压力。

阿里的会议室多得像森林里的树木,终于坐下,一张桌子,两杯咖啡。

杨红霞博士扎着利落的马尾,额前干净,没有刘海,少量碎发。

她说起话来,爽爽快快,普通话极为流利标准。

她告诉我:“我实话跟你说,为什么会回国?”

她的答案真好,连标点符号里都流露出温柔的真诚与强烈的技术愿景。

“我最喜欢的技术是从复杂的业务里抽象出来,用技术去解决实际问题。我不喜欢走反过来的路,假如走反过来的路,我可以选择去研究型的高校。”

“所有人都要有一些耐心,没有耐心,永远只有单点的结果,很难去实现线和面。”

当天的独家专访的主要内容有以下几点:

第一,如今的深度学习的模型已经不能满足我们的更多要求了。因为说白了可能这个算法模型刚出现的时候只能满足一些特别low(低)的要求,慢慢地,我们会越来越接近通用人工智能,要求的高度肯定是越来越高的。

第二,阿里巴巴希望在一些很重要的核心方向上,尤其是在支撑人工智能的下一个阶段的技术和产品上,可以做到世界领先。

第三,其他技术细节。

我就不写技术细节了,如果写了,按照谭老师做事的规矩,要先拿给该司负责这方面的同学审核才能出稿,我不写,也就免了。

可以看出,阿里巴巴很早就认得清下一代人工智能的价值,他们也很早出发了。

谈话的最后,杨红霞博士请我品尝了阿里巴巴食堂的鸭血粉丝汤,挺好吃的。

夜幕降临淘宝城,我明白了中国的AI科学家们在思考:在下一代人工智能的浪潮当中,中国到底哪些技术可以作为世界第一?

在与杨红霞博士面谈之后,我又和几位技术大佬聊过。

贾扬清,林伟(原微软亚洲研究院研究员,原微软硅谷研究院研究员,阿里云机器学习PAI平台负责人),曹政。

他们分别代表的是三层不同的内容:框架,平台,云基础设施。再算上杨红霞的模型算法团队。

一个AI大模型汇集了如此多的大佬。

可以看出,对于AI大模型,阿里投入的是整建制的团队,调动的不只是达摩院的力量。

所以,才会有M6大模型的问世。

这基本上是互联网公司制造大模型的标准打法,多个团队“共建”一个模型。

前后与多位专家多次长聊之后,我清楚地理解到,想做出超级AI大模型(那时候还没有ChatGPT),仅靠一支算法团队远远不够。

大模型团队是由几支分别擅长于不同领域(AI算力,AI框架,AI平台)的技术团队合力而成。

因为一些外力,我和杨红霞博士的故事就在这里戛然而止了,那次采访没有出稿。

2023年春节前后,我得知杨红霞博士已经去了今日头条。此后,所有人问起我关于她离职的消息,我都三缄其口。

我们聊回ChatGPT这类AI大模型。这么重要的特大工程,底层能不重要吗?

需要解释一下,在互联网大厂,底层是共用的。阿里巴巴如此,华为,腾讯,皆如此。

OneFlow的独特之处在于,这支团队挑了一个大厂云集的赛道,看上去不是去战斗,更像是去“送死”。

这是一个“置之死地,方可后生”的故事。我很激动地见证了这个故事“讲述”到今天。

在ChatGPT爆发之际,人才尤为可贵,“购买”独立团队比“挖”互联网大厂整建制的团队好操作,这也是收购可能发生的原因之一,就看袁进辉博士和光年之外谈判的价格了。

回到ChatGTP,AI算力、AI框架、AI平台、AI模型合力创造了AI大模型的成功。

当然,ChatGPT有模型层面的“独家秘方”。

为什么我一直在反复强调合力?

大家都看到了,ChatGPT和GPT-4的成功“另有高明”。

ChatGPT不是孤胆英雄的成功,而是科技巨头和通用人工智能狂人的合作,一个巨大,一个微小。

说白了,巨头微软再成功,能力再强,也没有仅凭一己之力搞定ChatGPT 。

好在,微软有眼光。OpenAI有股权结构和公司治理的神奇想法。

于是,强强联合成功。

于是,新模式成功。

同时,“亲爱的数据”获悉,中国“名列前茅”的某科技巨头已经和多支非互联网AI大模型团队见面。

其谈判策略就是:“我”作美国微软,“你”作美国OpenAI。这个策略可真好,看懂掌声。

稍微插一句,有的大厂布局了不仅仅一个GPT类型的大模型。当然,这又是另一个故事了。

总而言之,中国的大模型团队分为两种:互联网和非互联网团队。

非互联网团队包括:

前美团联合创始人王慧文团队,中科院自动化所紫东太初团队,清华系智谱华章团队,杭州的西湖心辰团队,北京的智源研究院团队,李开复的Project AI 2.0团队。

这个名单的长度还会增加,因为我看到有些投资人已经“急不可耐”了。

某AI大佬曾谈到:

“观察硬件和算力平台,如果没有某国的捣乱,整体而言,我们的硬件计算能力,计算量,以及就是说我们的一些底层的核心技术,比如说像高性能网络、高性能存储、异构计算等等。在国际上,大家的能力拉平,大同小异,更多是在强调怎么样用好这些资源。”

如今基建扎实支撑,ChatGPT这个“庞然大物”横空出世。

如今OneFlow也被知名大模型团队收购了,足见其意义。

AI新基建的范畴在变大。

一开始,GPT系列大模型不是基建。

2023年,GPT-4大模型现在已经是新基建的一部分了。

在ChatGPT引领的这一产品架构下,终端应用和底层大模型的联动十分紧密。

今天看来,AI大模型是电,我们要有自己的发电厂。

九章云极创始人方磊说:“AI大模型是电,可发电厂并不是垄断的。可以大家都盖一些发电厂。”

接下来,无论是大玩意,还是小玩意,我们把大模型玩起来,耍起来,在应用层面发展起来。

这句话不是我提的,巧了,很多AI大佬都和我说过同一句话。哪怕不是超级应用,哪怕只是做一个好用的小东西,用起来才是重要,流行起来更是王道。

接下来,就看各路大神们先如何打破ChatGPT天花板,接着再怎么做出超级应用。

啰嗦了这许多。最后我只想说,恭喜袁进辉博士,恭喜OneFlow团队。

我特别想对袁老师说:“请原谅我在股东大会还没有开完,协议还没有签下的时候就发稿。”

(这也是文章标题《前美团高管王慧文“正在”收购国产AI框架OneFlow,光年之外新联创袁进辉就位》中,“正在”一词的由来。)

都不容易,相互体谅,理解万岁。

有人在读者群问我:“中国AI大模型四小龙会是谁?”

提出这个问题的朋友的思维还停留在上一轮AI热潮。

某种意义上,AI大模型的奇点已过。

我的答案是:有可能中国AI大模型不会有四小龙,但会有多个团队争夺大模型的高地。

万一追不上怎么办?那很有可能,一家独大,大家全挂。

换句话说,我的观点是,假如美国OpenAI公司和微软公司赢家通吃,这里的赢家只有一家(一对),那会发生什么样的事情?

这样的话,可能很大一堆产业都最多成为依附在巨头API上的服务商。

这可太糟了。

好消息是,先进技术领先的时间窗口非常短暂。

坏消息是,“赢家”的布局超级迅猛。

这也反映出他们自知领先时间并不是那么多,也有很强的危机感。

中国AI大模型创业者们在焦虑中临机制变。

昔日我笔下的“骗子”已不知去向,而“疯子”在太阳升起的地方,沐浴着金色而悠远的晨光,再次出发,留给地平线崭新的背影。

有机会见证历史一刻,可真激动……

(完)

3011cfb5a3143f8c50da9e783caf371e.jpeg

更多阅读

AI框架系列:

1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)

2.搞AI框架那帮人丨燎原火,贾扬清(二)

3.搞 AI 框架那群人(四):AI 框架前传,大数据系统 往事

4.搞 AI 框架的那群人(三):狂热的 AlphaFold 和沉默 的中国科学家

注:(三)和(四)现在并未公开发表,将会以图书出版的形式与各位见面。

漫画系列

1. 解读硅谷风投A16Z“50强”数据公司榜单

2. AI算法是兄弟,AI运维不是兄弟吗?

3. 大数据的社交牛逼症是怎么得的?

4. AI for Science这事,到底“科学不科学”?

5. 想帮数学家,AI算老几? 

6. 给王心凌打Call的,原来是神奇的智能湖仓

7. 原来,知识图谱是“找关系”的摇钱树?

8. 为什么图计算能正面硬刚黑色产业薅羊毛?

9. AutoML:攒钱买个“调参侠机器人”?

10. AutoML:你爱吃的火锅底料,是机器人自动进货

11. 强化学习:人工智能下象棋,走一步,能看几步?

12. 时序数据库:好险,差一点没挤进工业制造的高端局

13. 主动学习:人工智能居然被PUA了?

14. 云计算Serverless:一支穿云箭,千军万马来相见

15. 数据中心网络:数据还有5纳秒抵达战场

16. 数据中心网络“卷”AI:迟到不可怕,可怕的是别人都没迟到

17. ChatGPT大火,如何成立一家AIGC公司,然后搞钱?

18. ChatGPT:绝不欺负文科生

19.从大神Alex Smola与李沐离职AWS创业融资顺利,回看ChatGPT大模型时代“底层武器”演进

20. ChatGPT触类旁通的学习能力如何而来?

DPU芯片系列:

1. 造DPU芯片,如梦幻泡影?丨虚构短篇小说

2. 永远不要投资DPU?

3. DPU加持下的阿里云如何做加密计算?

4. 哎呦CPU,您可别累着,兄弟CIPU在云上帮把手

长文系列:

1. 我怀疑京东神秘部门Y,悟出智能供应链真相了

2. 超级计算机与人工智能:大国超算,无人领航

132b067b5ecbc3c8e10b3604b06625ee.jpeg

最后,再介绍一下主编自己吧,

我是谭婧,科技和科普题材作者。

为了在时代中发现故事,

我围追科技大神,堵截科技公司。

偶尔写小说,画漫画。

生命短暂,不走捷径。

个人微信:18611208992

原创不易,多谢转发

还想看我的文章,就关注“亲爱的数据”。  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/18738.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

对话AI顶尖大牛周明老师:大模型的机遇和挑战?

Datawhale学习 分享人:周明老师,Datawhale 特邀嘉宾 这次 Datawhale开源学习 特别邀请了周明老师分享: 周明,澜舟科技创始人兼CEO,中国计算机学会 CCF 副理事长、NLP和大模型领域的顶尖大牛。 1991年就从NLP重镇哈工大…

对话李彦宏:AI 大模型时代,应用开发机会比移动互联网大十倍

AI 2.0 时代,ChatGPT 的出现,让大模型引发的诸神之战正式打响。百度作为中国首个推出真实应战“武器”的公司,其基于千亿量级数据炼就而成的“文心一言”背后,蕴藏哪些鲜为人知的故事?这种打破人类对过往 NLP 之智能对…

从大神Alex Smola与李沐离职AWS创业融资顺利,回看ChatGPT大模型时代“底层武器”演进...

图文原创:亲爱的数据 “Were building something big ... stay tuned. Talk to me if you want to work on scalable foundation models.” “我们正在建造一个大项目……请继续关注。如果你想在可扩展基础模型上工作,请告诉我。” “参数服务器之父” A…

单元测试编写最佳实践(ChatGPT+Mockito+JUnit)

背景 基于 springboot 微服务架构给单元测试带来的问题: springboot 单元测试启动家长过程非常缓慢,后期服务启动达到分钟级,非常影响效率服务之间相互依赖非常严重,单元测试的运行非常依赖其它服务稳定性第三方服务和中间件&am…

一种基于GOP改进的口语语音评测算法

最近在看语音评测的算法,看到2019年INTERSPEECH 2019 的的一篇paper。这篇主要是研究了 HMM transition probabilities对语音评测的影响。 测试后发现还是比原来的GOP语音评测算法有所改善。

微信版大语言模型来了:跨时空对话李白、教你高情商说话,API在线试玩全都有...

鱼羊 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 大规模语言模型,微信版,来了! 并且甫一登场,就没藏着掖着: 论文、API接口、在线试玩网站……一条龙全都齐备。 续写文本、阅读理解等常规任务就不说了,这个名…

元语AI(ChatYuan): ChatGPT中文版尝试?功能型对话大语言模型.beta版

元语AI是什么 我们训练了一个叫做元语AI(ChatYuan)的模型,它可以通过对话形式进行交互。它可以回答问题,具有联系上下文的能力;可以写文章、写作业、写诗歌、做中英文间的翻译;一些法律等特定领域问题也可以…

李宏毅HW01——新冠疫情数据的预测

目的:熟悉熟悉pytorch 导入数据 !gdown --id 1kLSW_-cW2Huj7bh84YTdimGBOJaODiOS --output covid.train.csv !gdown --id 1iiI5qROrAhZn-o4FPqsE97bMzDEFvIdg --output covid.test.csv/Users/missbei/miniforge3/envs/NLP_search/lib/python3.8/site-packages/gdo…

基于Spark对美国新冠肺炎疫情数据进行分析

2020年美国新冠肺炎疫情数据分析 基于Spark对美国新冠肺炎疫情数据进行分析一、实验环境二、数据集加载三、使用Spark对数据进行分析四、数据可视化 基于Spark对美国新冠肺炎疫情数据进行分析 此案例以2020年美国新冠肺炎疫情数据作为数据集,以Python为编程语言&am…

Chinese medical dialogue data 中文医疗对话数据集

Chinese medical dialogue data 中文医疗对话数据集 Data_数据中有6个文件夹分别是: <Andriatria_男科> 94596个问答对 <IM_内科> 220606个问答对 <OAGD_妇产科> 183751个问答对 <Oncology_肿瘤科> 75553个问答对 <Pediatric_儿科> 101602个问答…

Python爬取新冠肺炎实时数据及其可视化分析

点赞、关注再看&#xff0c;养成良好习惯 Life is short, U need Python 初学Python&#xff0c;快来点我吧 案例&#xff1a;Python爬取新冠肺炎实时数据及其可视化分析 作者&#xff1a;PyQuant 博客&#xff1a;https://blog.csdn.net/qq_33499889 慕课&#xff1a;https:…

北大研究团队面向新冠疫情的数据可视化分析与模拟预测

本次pythonday开发者日活动有幸请到北京大学的陈宝权教授做分享&#xff0c;以下是陈教授近期进行的面向新冠疫情的数据可视化分析与模拟预测项目&#xff0c;陈教授将会在本次活动上做分享与答疑&#xff0c;欢迎大家参与&#xff01; 指导教师&#xff1a;陈宝权教授&#xf…

利用Python获取新冠状病毒肺炎的疫情数据并进行可视化分析,看不懂你打我

文章目录 数据挖掘案例&#xff1a;利用Python获取新冠状病毒肺炎的疫情数据并进行可视化分析一、疫情数据报告网站地址1.1 pyecharts介绍1.2 要用到的库1.3 爬取数据1.3.1 方法11.3.2 方法2&#xff08;采用&#xff09;1.地址2.自己来获取试试看 二、爬取的数据初查看三、爬取…

大数据实战 --- 世界新冠疫情数据分析

目录 开发环境 数据描述 功能需求 数据准备 统计计算 Hbase Hive 分析数据 开发环境 HadoopHiveSparkHBase 启动Hadoop&#xff1a;start-all.sh 启动zookeeper&#xff1a;zkServer.sh start 启动Hive&#xff1a; nohup hiveserver2 1>/dev/null 2>&1 &…

【Python】2020年美国新冠肺炎疫情数据分析

2020年美国新冠肺炎疫情数据分析 一、 需求描述二、 环境介绍三、 数据来源描述四、 数据上传及上传结果查看五、数据处理过程描述1、数据集下载2、格式转换3、启动Hadoop集群4、将文件上传至HDFS文件系统中5、使用Spark对数据进行分析6、读取文件生成DataFrame8、数据可视化 六…

数据分享|函数型数据分析部分省市新冠疫情数据

作者&#xff1a;Mingji Tang 统计学中传统的数据类型有截面数据和时间序列数据。这两者都只能在某一纵向或横向上探究数据&#xff0c;且部分前提条件又很难满足。而函数型数据连续型函数与离散型函数长期以来的分离状态&#xff0c;实现了离散和连续的过度。它很少依赖于模型…

利用Python爬取新冠肺炎疫情实时数据,Pyecharts画2019-nCoV疫情地图

前言 博客是2年前写的&#xff0c;中间有好多网友私信我获取源码及指出部分bug&#xff0c;感谢支持&#xff01; 取不到数据的原因是数据接口发生较大变化&#xff0c;最近刚好有时间&#xff0c;所以重新整理了一下。 第一部分 网页分析 数据源 腾讯疫情实时追踪 今天重新整…

新冠肺炎国内外疫情数据爬取

环境说明 爬虫环境&#xff1a; Python3 IDE:Pycharm 爬虫工具包&#xff1a; requests BeautifulSoup json 从腾讯新闻网爬取 使用chrome浏览器对腾讯新闻网进行页面元素审查&#xff0c;进入network&#xff0c;刷新&#xff0c;查看response&#xff1a; 寻找到这三个js文…

[Pyhon疫情大数据分析] 四.微博话题抓取及新冠肺炎疫情文本挖掘和情感分析

思来想去,虽然很忙,但还是挤时间针对这次肺炎疫情写个Python大数据分析系列博客,包括网络爬虫、可视化分析、GIS地图显示、情感分析、舆情分析、主题挖掘、威胁情报溯源、知识图谱、预测预警及AI和NLP应用等。希望该系列线上远程教学对您有所帮助,也希望早点战胜病毒,武汉…

爬取WHO各国病例数据

还在为拿不到官方病例数据而发愁吗&#xff1f; WHO各国病例数据如下&#xff1a; https://experience.arcgis.com/experience/685d0ace521648f8a5beeeee1b9125cd 我们的目的就是爬出这个图中的数据&#xff1a; 审查元素 首先我们随便点开一个国家的疫情情况&#xff1a;…