从大神Alex Smola与李沐离职AWS创业融资顺利,回看ChatGPT大模型时代“底层武器”演进...

图文原创:亲爱的数据

We're building something big ... stay tuned. Talk to me if you want to work on scalable foundation models.

我们正在建造一个大项目……请继续关注。如果你想在可扩展基础模型上工作,请告诉我。

“参数服务器之父” Alex Smol教授已于20232月从美国著名公有云厂商亚马逊云科技(AWS)离职,创办了一家名为Boson.ai的人工智能公司。

2dc44e0ca7ec29a704a10b7947769e06.png

公元2023年的春天,显然也是人工智能的又一春。

Alex Smol教授重新出发并在领英公布了新目标:

scalable foundation models”(可扩展基础模型)。

这类厂商可被视为ChatGPT跟随者,说是挑战者也行。

不久之前,或者说一周前,他的就职宣言是:“我很高兴地告诉大家,我将在 Boson.ai 开始担任首席执行官兼联合创始人的新职务!”

官宣语不惊人,实则不然,大神李沐也会加入,一同创业。

李沐既没有官宣离旧职,也没有官宣入新职。

079bee949a741fcd3042669e8aefb05c.png

业内人士对我说的原话是:“一起创业。”

更进一步的消息是:“融资也很顺利。”

两位神级AI科学家同期离职,共同创业。

有什么事情能感召AI大佬离开顶级大厂创业,那非ChatGPT这样的大模型机会莫属。

AI从不缺惊喜,一路走来都是惊喜,缺的是惊艳。AI已经好久没有新的神秘力量了,AI的尊严都被ChatGPT一把给找回来了。

多年观察,这两位大神师生的故事让我既感慨,又羡慕。

他们大约相识于2012年前后,计划读博的学生几乎都会提前和导师有所沟通。第一次的接触无处可考,可以确定的是20128月左右,李沐收到了美国卡内基梅隆大学(CMU)的入学通知。

人人都有万里路,只看你与谁同行。

此后的岁月里,大厂组队,一起写书,一起创业。

那本《动手学深度学习》被业内视为入门深度学习的优秀教材(虽然作者不止他俩)。

20212月,我曾在《搞深度学习框架的那帮人,不是疯子,就是骗子》一文中写过他们的部分经历:

“谈起亚马逊和MXNet框架的缘分,就不得不提起一位美国卡内基梅隆大学(CMU)的高人,Alex Smola教授,他也是李沐在CMU的博士导师。2016年7月,Alex Smola教授重返工业界,加入亚马逊AWS担任副总裁级别的科学家(职级为Distinguished Scientist/VP)。大半年后,2017年3月,李沐加入AWS,直接向老师Alex Smola汇报。 师徒同框,双手比V。”

此后,李沐大神洪水般的流量从知乎冲到B站,技术从业者追捧指数业界首屈一指。

“车库教学”“论文精讲”“师从李沐”……说实话,别说初学者、资深工程师、硕博牛人在看,连谭老师我也一连看了好几集,不仅弹幕欢乐,而且回味无穷。

7年光阴转眼间。

虽然Alex Smola是美国名校教授,前AWS高管,但是很多人对他还比较陌生。“参数服务器之父”的名头也不甚响亮。

参数服务器已经是“上古神器”,很早以前没有别的方法,只有它这一种。当年深入观察之后,至今令我印象深刻的,是其思路的巧妙。

这里一定要讲讲参数服务器的前世今生,以及一些AI训练方法上的演进。

一切糟心事的根源都在于模型在变大。

往哪里存,往哪里放,是其中的关键。

除了参数,还有样本抽取的输入,中间结果等等。这些东西,哪样搞坏搞错了,结果都承受不起。

模型小、单机单卡的情况下,信息都在一台机器上,一人闯天下。

要团队,就要分工。分布式训练中,信息要被多人分享。分享效率低,工作就会排队,排队就会浪费时间。

3个人分工,和300人分工,3000人分工,事情不是一个性质。

算力已经很厉害了,于是,AI计算呼唤高性能高带宽的存储和网络。

此时,Alex Smola教授的参数服务器就大有用处。如果你要问其本质是什么,我的答案是:分布式存储和分布式计算。

两者的占比关系是,分布式存储占大头,分布式计算占少量。

参数服务器是一个冲锋队,有领队(server),有分工队员(worker)。专业一点的说法是,分布式训练集群中的节点被分为两类:parameter serverworker

worker是分工队员似乎也不是很准确,因为worker这个程序,不是参数服务器的一部分,大家一起协同而已。

9122d2a9d3ec1f81a469aed921a56122.png

总之,serverworker一起干活,server存放模型参数,汇总完了再更新给workerworker认真干活,server不停地给worker同步“消息”。

这样看上去server像职场里消息灵通的保管员。

除了存储,那一小部分计算是什么?是参数汇总和参数更新的策略等等。

简单原理如上。

一个底层软件层面的巧妙设计,让模型的扩展性战斗指数狂飙起来了。

假如没有参数服务器呢?那么,模型大的压力,就只剩硬件解决方案在硬抗。

比如,工程师做个两级或者三级存储,一部分放显存,一部分放内存,一部分放硬盘。

如此这般,还只是考虑了存储,把计算结果同步的事情搁置在一旁。

于是,我们会说参数服务器对深度学习模型训练的性能和效果的影响都很大。

AI时代,任何影响性能和效果的事情,都是天大的事情。模型靠这个吃饭,干砸了碗就砸了。

AI领域有难题,永远不缺乏解决问题的人。

这时候,超级计算机里的一个技术被拿来解决AI的问题。这个技术就是已经用在并行计算架构里的通信机制。

标志性的里程碑是Ring All reduce,出自2016年百度公司的一篇论文,技术是从“隔壁”借鉴而来的。这事从论文标题一眼就能看出来——《将高性能计算技术引入深度学习》。All Reduce翻译为规约,Ring是环状的意思。

原理就不讲了,Ring All reduce“表现”优秀,使用者越来越多。

或者我们调侃一句:“人工智能的臭毛病,让高性能计算治好了。”

再后来,谷歌和IBM等大公司又不断地拿出新思路。

很难知道OpenAI公司支撑ChatGPT大模型的类似技术是什么思路。

但我们知道,难题在产生,也在被攻克。

比如,大模型分布式存储需要支持1T10T级别的存储量。

前面也提过,计算(训练)过程里,模型大,中间量(中间变量,优化器状态,参数更新频次和频次表,还有其他变量等等)的体量可能会膨胀4倍。

原来一室一厅够住了,现在高低得整个四室一厅。

这里只谈了一部分工作,协同训练是很有挑战的技术难题

世事不难,吾辈何用。

在分布式上怎么把算力调动起来这件事远没有止境,并且正在持续吸引更多才俊加入到这个领域里来。

谈了很多都是陈年旧事,而人工智能方法上的提高从来没有停止,我只考古了其中几步。

重要之处在于,正是有了底层软件支持,才有了上层大模型的繁荣与爆发。

Alex Smola教授和李沐是这个领域里的大神,他们的实力和眼光都是世界一流的。

ChatGPT火了,在AI应用层急切呼唤惊艳产品的当下,硅谷著名风投A16Z说“基础设施提供商是这个市场中的最大赢家”。

我认为把AI平台、AI框架和AI芯片一起打包定义为“AI基础设施”较为合适。

AI芯片的赢面所有人都已看见,我认为在可预见的将来,Alex Smola教授在本文开头谈到的 “scalable foundation models” ,也就是基础大模型,会成为AI基础设施的一部分。

美国公司OpenAI的基础模型已经足够强大,对它进行改造和再加工的成本很低(相对于从头开发)。

2bb6fcfcce02b079c33533a01765cd29.png

如此一来,云计算厂商即将决胜的战场就是基础大模型能力,有则PaaS层胜出,无则惨败。

在“大模型一出,谁与争锋”的宏大背景音乐里,独立软件公司只要做得足够好,机会就在招手。我想Alex Smola教授和李沐大神选择加入这场战役的原因在于此。

他日“得AI框架者得天下”,

今朝“得基础大模型者得天下”。

大神们独立门户,有决心,有梦想,有市场机会,有资本支持,有对技术的热忱与投入,时不我待。

回忆几年前,好几家云计算厂商对大模型的投入,都想瞅着他人情况行事,没有投入的决心。甚至有的厂商,哪个技术中干开会提要做大模型,老板就当场痛骂谁。

这样也没错,谁不是扛着业绩边擦泪边奔跑。

只是跟随者这把椅子有时候坐着舒服,有时候不舒服。

此地彼方,唏嘘不已。

(完)

bc841df22889416e684ca79fc4ee7ea5.jpeg

更多阅读

AI框架系列:

1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)

2.搞AI框架那帮人丨燎原火,贾扬清(二)

漫画系列

1. 解读硅谷风投A16Z“50强”数据公司榜单

2. AI算法是兄弟,AI运维不是兄弟吗?

3. 大数据的社交牛逼症是怎么得的?

4. AI for Science这事,到底“科学不科学”?

5. 想帮数学家,AI算老几? 

6. 给王心凌打Call的,原来是神奇的智能湖仓

7. 原来,知识图谱是“找关系”的摇钱树?

8. 为什么图计算能正面硬刚黑色产业薅羊毛?

9. AutoML:攒钱买个“调参侠机器人”?

10. AutoML:你爱吃的火锅底料,是机器人自动进货

11. 强化学习:人工智能下象棋,走一步,能看几步?

12. 时序数据库:好险,差一点没挤进工业制造的高端局

13. 主动学习:人工智能居然被PUA了?

14. 云计算Serverless:一支穿云箭,千军万马来相见

15. 数据中心网络:数据还有5纳秒抵达战场

16. 数据中心网络“卷”AI:迟到不可怕,可怕的是别人都没迟到

17. ChatGPT大火,如何成立一家AIGC公司,然后搞钱?

18. ChatGPT:绝不欺负文科生

DPU芯片系列:

1. 造DPU芯片,如梦幻泡影?丨虚构短篇小说

2. 永远不要投资DPU?

3. DPU加持下的阿里云如何做加密计算?

4. 哎呦CPU,您可别累着,兄弟CIPU在云上帮把手

长文系列:

1. 我怀疑京东神秘部门Y,悟出智能供应链真相了

2. 超级计算机与人工智能:大国超算,无人领航

3. 售前,航空母舰,交付,皮划艇:银行的AI模型上线有多难?

c46696581dad35f3491f87c312409486.jpeg

最后,再介绍一下主编自己吧,

我是谭婧,科技和科普题材作者。

为了在时代中发现故事,

我围追科技大神,堵截科技公司。

偶尔写小说,画漫画。

生命短暂,不走捷径。

个人微信:18611208992

原创不易,多谢转发

还想看我的文章,就关注“亲爱的数据”。  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/18735.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

单元测试编写最佳实践(ChatGPT+Mockito+JUnit)

背景 基于 springboot 微服务架构给单元测试带来的问题: springboot 单元测试启动家长过程非常缓慢,后期服务启动达到分钟级,非常影响效率服务之间相互依赖非常严重,单元测试的运行非常依赖其它服务稳定性第三方服务和中间件&am…

一种基于GOP改进的口语语音评测算法

最近在看语音评测的算法,看到2019年INTERSPEECH 2019 的的一篇paper。这篇主要是研究了 HMM transition probabilities对语音评测的影响。 测试后发现还是比原来的GOP语音评测算法有所改善。

微信版大语言模型来了:跨时空对话李白、教你高情商说话,API在线试玩全都有...

鱼羊 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 大规模语言模型,微信版,来了! 并且甫一登场,就没藏着掖着: 论文、API接口、在线试玩网站……一条龙全都齐备。 续写文本、阅读理解等常规任务就不说了,这个名…

元语AI(ChatYuan): ChatGPT中文版尝试?功能型对话大语言模型.beta版

元语AI是什么 我们训练了一个叫做元语AI(ChatYuan)的模型,它可以通过对话形式进行交互。它可以回答问题,具有联系上下文的能力;可以写文章、写作业、写诗歌、做中英文间的翻译;一些法律等特定领域问题也可以…

李宏毅HW01——新冠疫情数据的预测

目的:熟悉熟悉pytorch 导入数据 !gdown --id 1kLSW_-cW2Huj7bh84YTdimGBOJaODiOS --output covid.train.csv !gdown --id 1iiI5qROrAhZn-o4FPqsE97bMzDEFvIdg --output covid.test.csv/Users/missbei/miniforge3/envs/NLP_search/lib/python3.8/site-packages/gdo…

基于Spark对美国新冠肺炎疫情数据进行分析

2020年美国新冠肺炎疫情数据分析 基于Spark对美国新冠肺炎疫情数据进行分析一、实验环境二、数据集加载三、使用Spark对数据进行分析四、数据可视化 基于Spark对美国新冠肺炎疫情数据进行分析 此案例以2020年美国新冠肺炎疫情数据作为数据集,以Python为编程语言&am…

Chinese medical dialogue data 中文医疗对话数据集

Chinese medical dialogue data 中文医疗对话数据集 Data_数据中有6个文件夹分别是: <Andriatria_男科> 94596个问答对 <IM_内科> 220606个问答对 <OAGD_妇产科> 183751个问答对 <Oncology_肿瘤科> 75553个问答对 <Pediatric_儿科> 101602个问答…

Python爬取新冠肺炎实时数据及其可视化分析

点赞、关注再看&#xff0c;养成良好习惯 Life is short, U need Python 初学Python&#xff0c;快来点我吧 案例&#xff1a;Python爬取新冠肺炎实时数据及其可视化分析 作者&#xff1a;PyQuant 博客&#xff1a;https://blog.csdn.net/qq_33499889 慕课&#xff1a;https:…

北大研究团队面向新冠疫情的数据可视化分析与模拟预测

本次pythonday开发者日活动有幸请到北京大学的陈宝权教授做分享&#xff0c;以下是陈教授近期进行的面向新冠疫情的数据可视化分析与模拟预测项目&#xff0c;陈教授将会在本次活动上做分享与答疑&#xff0c;欢迎大家参与&#xff01; 指导教师&#xff1a;陈宝权教授&#xf…

利用Python获取新冠状病毒肺炎的疫情数据并进行可视化分析,看不懂你打我

文章目录 数据挖掘案例&#xff1a;利用Python获取新冠状病毒肺炎的疫情数据并进行可视化分析一、疫情数据报告网站地址1.1 pyecharts介绍1.2 要用到的库1.3 爬取数据1.3.1 方法11.3.2 方法2&#xff08;采用&#xff09;1.地址2.自己来获取试试看 二、爬取的数据初查看三、爬取…

大数据实战 --- 世界新冠疫情数据分析

目录 开发环境 数据描述 功能需求 数据准备 统计计算 Hbase Hive 分析数据 开发环境 HadoopHiveSparkHBase 启动Hadoop&#xff1a;start-all.sh 启动zookeeper&#xff1a;zkServer.sh start 启动Hive&#xff1a; nohup hiveserver2 1>/dev/null 2>&1 &…

【Python】2020年美国新冠肺炎疫情数据分析

2020年美国新冠肺炎疫情数据分析 一、 需求描述二、 环境介绍三、 数据来源描述四、 数据上传及上传结果查看五、数据处理过程描述1、数据集下载2、格式转换3、启动Hadoop集群4、将文件上传至HDFS文件系统中5、使用Spark对数据进行分析6、读取文件生成DataFrame8、数据可视化 六…

数据分享|函数型数据分析部分省市新冠疫情数据

作者&#xff1a;Mingji Tang 统计学中传统的数据类型有截面数据和时间序列数据。这两者都只能在某一纵向或横向上探究数据&#xff0c;且部分前提条件又很难满足。而函数型数据连续型函数与离散型函数长期以来的分离状态&#xff0c;实现了离散和连续的过度。它很少依赖于模型…

利用Python爬取新冠肺炎疫情实时数据,Pyecharts画2019-nCoV疫情地图

前言 博客是2年前写的&#xff0c;中间有好多网友私信我获取源码及指出部分bug&#xff0c;感谢支持&#xff01; 取不到数据的原因是数据接口发生较大变化&#xff0c;最近刚好有时间&#xff0c;所以重新整理了一下。 第一部分 网页分析 数据源 腾讯疫情实时追踪 今天重新整…

新冠肺炎国内外疫情数据爬取

环境说明 爬虫环境&#xff1a; Python3 IDE:Pycharm 爬虫工具包&#xff1a; requests BeautifulSoup json 从腾讯新闻网爬取 使用chrome浏览器对腾讯新闻网进行页面元素审查&#xff0c;进入network&#xff0c;刷新&#xff0c;查看response&#xff1a; 寻找到这三个js文…

[Pyhon疫情大数据分析] 四.微博话题抓取及新冠肺炎疫情文本挖掘和情感分析

思来想去,虽然很忙,但还是挤时间针对这次肺炎疫情写个Python大数据分析系列博客,包括网络爬虫、可视化分析、GIS地图显示、情感分析、舆情分析、主题挖掘、威胁情报溯源、知识图谱、预测预警及AI和NLP应用等。希望该系列线上远程教学对您有所帮助,也希望早点战胜病毒,武汉…

爬取WHO各国病例数据

还在为拿不到官方病例数据而发愁吗&#xff1f; WHO各国病例数据如下&#xff1a; https://experience.arcgis.com/experience/685d0ace521648f8a5beeeee1b9125cd 我们的目的就是爬出这个图中的数据&#xff1a; 审查元素 首先我们随便点开一个国家的疫情情况&#xff1a;…

Python数据分析高薪实战第十天 EDA实战-全球新冠肺炎确诊病例趋势分析

27 初识 EDA&#xff1a;全球新冠肺炎确诊病例趋势分析 从本讲开始&#xff0c;我们会通过四个具体的案例来将我们之前学习的 Python 数据分析方面的知识全都串起来。一方面能够融会贯通&#xff0c;另一方面也能帮你掌握数据分析基本的方法论。 本讲我们首先会介绍数据分析中…

【大数据基础】2020年美国新冠肺炎疫情数据分析

https://dblab.xmu.edu.cn/blog/2738 https://dblab.xmu.edu.cn/blog/2636/ spark 安装 安装 Spark2.4.0 sudo tar -zxf ~/下载/spark-2.4.0-bin-without-hadoop.tgz -C /usr/local/ cd /usr/local sudo mv ./spark-2.4.0-bin-without-hadoop/ ./spark sudo chown -R hadoop:…

新冠疫情分析(疫情数据爬取+数据分析+网页排版展示)

新冠疫情来临&#xff0c;我简单的做一次疫情的数据分析温习我的python知识&#xff0c;也希望能帮到各位。分析中我用到的技术有&#xff1a;pyton爬取数据htmlcss将分析结果排版。用到的工具有exceltableau进行数据处理分析和绘图。数据分析中还是存在很多的不足&#xff0c;…