大神李沐、快手元老李岩被曝离职后转投大模型，ChatGPT掀起AI创业狂飙

大神李沐、快手元老李岩被曝离职后转投大模型，ChatGPT掀起AI创业狂飙

news/2025/1/11 12:00:21/文章来源:https://blog.csdn.net/weixin_36896856/article/details/129414769

点击上方“AI遇见机器学习”，选择“星标”公众号

重磅干货，第一时间送

来自：新智元

编辑：编辑部

【导读】在B站讲论文的李沐大神被曝出从亚马逊离职，与导师一同投身大模型创业。无独有偶，快手前AI核心人物李岩，也被曝出加入大模型创业赛道。

最近，互联网大佬纷纷投身大模型赛道。

昨天，李沐大神离职亚马逊、去做大模型的消息，如同惊雷一般炸响了大家的社交网络。

紧接着，今天又曝出前快手AI核心大佬李岩在2022年离职快手后成立的新公司，做的也是大模型。

显然，自从ChatGPT让全世界看到了AI上天入地般的应用场景，国内企业的AI模型层竞争，已经开始白热化了。

快手大佬李岩创业，进军多模态

据36氪独家报道，李岩在2022年下半年成立了AI公司「元石科技」，主要进行多模态大模型的研发。

李岩是工号在75上下的快手老员工，也是快手AI技术研发的核心人物。

2015年11月，在时任快手CEO的宿华的支持下，李岩组建了内部第一个深度学习部门DL（Deep Learning）组，目标是构建算法模型对违法违规的视频内容进行识别。

随后，快手对视频内容理解产生了更多的需求。2016年，李岩将团队的名字从DL组改为MMU（Multimedia understanding，多媒体内容理解）组，在解决安全合规问题之外，涉猎语音、文字、图像等多种形式的算法模型研发。

在2018年的CNCC大会上，李岩便以题为「多模态内容生产与理解」的演讲，强调了多模态模型技术的重要性：

改变人机交互的方式
使信息分发更加高效

以我们经常刷的短视频为例，除了视觉、听觉和文本这些多模态信息外，用户的行为也是另外一种模态的数据。

如此一来，视频的本身再加上用户的行为，就共同构成了一个非常复杂的多模态问题。

而多模态研究的目的便是，让人机交互的方式变得越来越自然和舒适。

然而，多模态的研究难度颇高。

一方面要面对单模态的语义鸿沟问题，以及如何针对不同模态的数据进行综合建模的异构鸿沟问题；另一方面，还要解决由于多模态数据集构建困难而造成的数据缺失问题。

当时，学术界有不少研究还是停留在单模态领域，而李岩则坚定地认为，未来多模态会成为更有价值的研究方向。

在快手的经历，让李岩对于AI在短视频上的生态有了第一线的深刻理解，2021年，他选择从快手离职。

2022年下半年，他成立了元石科技，根据36氪的独家求证，元石科技主攻的就是多模态大模型的研发。

师徒一体：写书、创业、再创业

而昨天，李沐大神疑似加入大模型创业的消息，也瞬间在社交网络上刷屏。

根据公号「亲爱的数据」消息，「参数服务器之父」Alex Smola在今年2月离职亚马逊，并创办了一家名为Boson.ai人工智能公司。

至于这家新公司的介绍资料并不多，目前官方页面还在建设中。

链接：https://boson.ai/

可以肯定的是，要做大模型相关的项目。

另根据Alex的领英主页介绍，「我们正在做一件大事。如果你对可扩展基础模型感兴趣，请联系我。」

值得注意的是，在这家公司GitHub主页上，亚马逊首席科学家李沐也贡献了代码。

因此，外界猜测李沐现已加入了Boson.ai，跟随导师一起去创业了。

不过，到目前为止，其主页还未更新。

李沐和Alex Smola曾在2016年创办了一家名为Marianas Labs数据分析算法公司。

当时，李沐任CTO兼联合创始人。

李沐曾在「博士这五年」一文中提到，

当时深度学习的火热导致各种巨资收购初创司不断。

Alex便和他拿了几十万的天使投资风风火火干了好一阵子，Alex写爬虫，他自己跑模型，后来卖给一个小上市公司公司1-Page。

要说师徒二人的相识最早是在卡耐基梅隆大学（CMU）。

2012年9月，李沐前往CMU深造，师从的便是Alex Smola。

当时，Alex还在谷歌任职，而且没有经费，就把他丢给了Dave Andersen。因此，李沐便有了两个导师，一个做机器学习，一个做分布式系统。

在CMU的前半年，李沐每周都会与两位导师一起聊一个小时。

由于两位导师风格迥异，而Alex反应特别快，想要跟上他的节奏很难。若想阐述自己的想法，需要做更多的功课。

而Dave会帮助李沐把一个东西理解透，不会给出很多想法。

在两个导师的辅导下，李沐迅速成长。

在CMU求学的第二年，正当余凯等人在做深度学习，李沐便也加入这波研究热潮。

基于对分布式深度学习框架的兴趣，他选择与陈天奇合作，将CXXNet作为起点，做深度学习相关项目。

在两人一起写xgboost 分布式启动脚本时，便发现文件读取可以是多个项目共同使用。

为了避免重复造轮子，李沐和陈天奇在合力在Github上创建了一个叫DMLC的组织，随后更是创建了随后大获成功的MXNet。

2016年7月，Alex加入了亚马逊。与此同时，李沐便带着MXNet先以兼职身份加入亚马逊，毕业后便选择留下。

2019年期间，师徒二人还曾在UC伯克利一起讲过课。

2021年，两人在斯坦福大学也一起讲授「Practical Machine Learning」。

值得一提的是，《动手学深度学习》这本书便是由李沐，美国伊利诺伊大学香槟分校计算机科学博士Aston Zhang，还有导师Alex一起所写。

这本书推出后便大受欢迎。作为MXNet的作者之一，李沐的这本《动手学深度学习》也是使用 MXNet 框架写成的

大模型路上，还有谁？

多模态的方向，是李岩很早就想做的。而李沐追随导师去创业，或许多少都受到了ChatGPT爆火的影响。

而国内企业的AI模型层竞争，已经开始白热化了。现在的大模型赛道中，挤满了巨头派、大佬派、海归/大厂高管派、小创业公司转型派、教授派、酱油派等各路选手。

2月13日，已经从美团退休2年的王慧文带着一纸「AI英雄榜」重回大众视野，称自己将拿出5000万美元「带资入组」，且「不在意岗位、薪资和title，求组队」。

前有王慧文把大模型创业的门票拉高到5000万美金之后，后有「出门问问」创始人李志文官宣下场大模型竞赛。

李志文曾在2020年领导团队，训练出大模型GPT-3中文版UCLAL

另外，还有前搜狗CEO王小川也发文隐晦地宣布，自己即将进入「中国的OpenAI」的战场，并向36氪承认自己在快速筹备中。

2月26日，衔远科技的创始人、首席科学家周伯文也发布一则消息称招募合伙人，一起打造中国版ChatGPT。

最近各种需求的激增，已经表明了国内生成人工智能产品的潜在市场大得惊人。

ChatGPT的爆火，意味着奇点已至，它引发了更底层、更深层的变化，新一代AI将融合物理世界和信息世界，实现知识、计算、推理的闭环。

短短两天内，就有两位大佬被曝下场创业，开辟大模型赛道。而国内巨头们预告的发布会，都将在几个月内召开。

所以，这场自开年就打响的AI大模型国内追逐赛，或许马上就能看到有选手冲刺终点了。

参考资料：

https://mp.weixin.qq.com/s/EEUDKjcEgvD1lGWCXHI36w

https://36kr.com/p/2160188716146944?f=rss

https://www.leiphone.com/category/ai/kXQzhaTsgKHNzbkU.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/45868.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

我和 chatGPT 对线操作系统！

我和 chatGPT 对线操作系统！

大家都知道现在 chatGPT 已经在多个领域展现了及其强大的工地，比如文案策划，毕业论文方便，甚至很多程序员都直接让 chatGPT 帮忙写代码了，在一些模板化的代码方面，chatGPT 更展示了优秀的能力。所以我突然迸发了一个…

阅读更多...

AI绘图实战（九）：给热门歌曲做配图 | Stable Diffusion成为设计师生产力工具

AI绘图实战（九）：给热门歌曲做配图 | Stable Diffusion成为设计师生产力工具

S：AI能取代设计师么？ I ：至少在设计行业，目前AI扮演的主要角色还是超级工具，要顶替？除非甲方对设计效果无所畏惧~~ 预先学习： 安装及其问题解决参考：《Windows安装Stable Diffusion …

阅读更多...

QT 借助图表实现音频频谱的绘制

QT 借助图表实现音频频谱的绘制

1.前言因为项目需要，要将音频播放并且实时展现其频谱图。项目中需要解析频谱数据，涉及到相关算法问题。所以博主没有采用网络上QT用QPainter库绘制频谱，而是采用了QChart来绘制频谱。 2.效果展示如图，红线为实时播放的位置&…

阅读更多...

微软小冰主要框架和流程及相关技术

微软小冰主要框架和流程及相关技术

主要是看了知乎上面一位作者写的解析，然后自己在看的过程中顺带记录一下，流程差不多，自己写的话复习比较直观快速 1、Query是用户输入的问题 2、DM（对话管理模块）层： 这一模块分为：状态追踪&…

阅读更多...

如何搭建一套免费开源的微信群机器人问答系统？

如何搭建一套免费开源的微信群机器人问答系统？

前言自动消息回复和机器人，一直是企业微信的专利。但在非常多场景或者人文习惯中，个人微信和微信群也同样需要它们。比如活动组织者、团购团长、社群管理、私域流量运营者们，都要经营个人微信群。那就不免会遇到许多信息收集、咨询提问的…

阅读更多...

如何设计一个最简化的推荐系统

如何设计一个最简化的推荐系统

本文目录结构 1、背景 2、推荐系统初识 3、通用推荐系统架构 4、经典推荐算法 5、实现一个推荐系统 6、存在问题与展望 1、背景近期由于公司业务系统需要做一个推荐系统，应该说是实现一个相当简单推荐逻辑。毕竟业务场景相当简单，企业的数据规模…

阅读更多...

AI 影评家: 用 Hugging Face 模型打造一个电影评分机器人

AI 影评家: 用 Hugging Face 模型打造一个电影评分机器人

❝ 本文为社区成员 Jun Chen 为百姓 AI 和 Hugging Face 联合举办的黑客松所撰写的教程文档，欢迎你阅读今天的第二条推送了解和参加本次黑客松活动。文内含有较多链接，我们不再一一贴出，请在文末阅读原文处点击查看渲染后的 Notebook 文件。…

阅读更多...

思否黑马圆满收官，28 支队伍创意使用 Jina AI 三款 AIGC 装备！

思否黑马圆满收官，28 支队伍创意使用 Jina AI 三款 AIGC 装备！

上周末，杭州被 AI 热潮所沸腾！SegmentFault AI Hackathon 杭州站暨思否 11 周年特别活动在 G5 创投中心拉开帷幕，超过 30 支团队参加了 32 小时的极限编程挑战，他们的产品展示直击评委的心，其中 28 支队伍得到了 Jina …

阅读更多...

BUAA-2023软件工程团队项目——选题和需求分析

BUAA-2023软件工程团队项目——选题和需求分析

BUAA MapForum 项目这个作业属于哪个课程2023北航敏捷软件工程这个作业的要求在哪里团队项目-选题和需求分析我在这个课程的目标是学习并实践软件工程开发的方法论。在把握整体流程和内容要素的基础上实践细节，培养开发技术、开发思维、团队协作等能力。这个作业在…

阅读更多...

2023年，请不要忽略！图神经网络(GNN)这一匹黑马！

2023年，请不要忽略！图神经网络(GNN)这一匹黑马！

点击下方“AINLPer“，关注我吧更多干货，第一时间送达引言虽然在过去的几个月里，「ChatGPT以及扩散模型(Diffusion Models)等生成式AI一直是人们关注的焦点，但也请不要忽略图神经网络(GNN)的迅速发展」。经过近几年的发展&#…

阅读更多...

AI大模型加速RPAxAI时代到来，谁会是RPA领域的杀手级应用？

AI大模型加速RPAxAI时代到来，谁会是RPA领域的杀手级应用？

GPT等AI大模型震撼来袭，基于RPA的超级自动化仍是最佳落地载体对话弘玑CPO贾岿，深入了解国产RPA厂商对AI大模型的探索与实践文/王吉伟关于RPA已死的说法，在中国RPA元年（2019年）投资机构疯狂抢项目之时就已经有了。…

阅读更多...

巧用提示词释放chatgpt的潜力

巧用提示词释放chatgpt的潜力

得益于 ChatGPT 和其他大型语言模型，提示词工程学（Prompt Engineering）像风一样已迅速成为我们生活的一部分。这是一个全新的非常受欢迎的领域。也就是说，现在是提高您的技能并在提示词工程学方面变得更好的最佳时机。如果您想知…

阅读更多...

【人工智能】只需要1分钟，GPT就帮我生成了思维导图

【人工智能】只需要1分钟，GPT就帮我生成了思维导图

自从人工智能横空而出，它在人们的生活中产生了巨大的影响。尤其在企业办公领域，借助人工智能的力量，能够迅速产出丰富多样的内容，无论对于企业还是个人都具有重要的帮助。想象一下，通过与人工智能的合作，您…

阅读更多...

Pandas + ChatGPT：交互式数据分析!

Pandas + ChatGPT：交互式数据分析!

Python Pandas是一个为Python编程提供数据操作和分析功能的开源工具包。这个库已经成为数据科学家和分析师的必备工具。它提供了一种有效的方法来管理结构化数据(Series和DataFrame)。在人工智能领域，Pandas经常用于机器学习和深度学习过程的预处理步骤。Pandas通过…

阅读更多...

计算机专业英语口语app,强烈推荐4款学英语必备的英语口语APP

计算机专业英语口语app,强烈推荐4款学英语必备的英语口语APP

我们大家都学了这么多年英语了，从小学到大学，但大多数人基本上学的都是应试类型的，甚至是哑巴英语。别人问你一句“How are you?”，你只会回答“I’m fine, thank you. And you?” 其他回答都想不起来。要是发音好也就算了&…

阅读更多...

自学英语的手机软件哪个好，负基础

自学英语的手机软件哪个好，负基础

我是一名英语过了大学六级的学生，学英语用软件是学不会的，分享一些方法你参考一下吧学习英语前的第一步：建立英语思维为什么大家学英语学得这么累，最后依然对英语糊糊涂涂？原因只有一个——就是我们的学习能力太差…

阅读更多...

Linux查询出口IP

Linux查询出口IP

查询的方式是通过Linux的curl访问查询ip的网站进行查询具体步骤： 1.查询查询ip网站的ip 2.配置Linux的hosts文件在/etc中的hosts文件增加上面的域名和ip（注意：是ifconfig，不是ipconfig） 3.在ssh命令下执行 curl ifc…

阅读更多...

为什么百度查到的ip和ipconfig查到的不一样？公网IP和私网IP 有什么区别？

为什么百度查到的ip和ipconfig查到的不一样？公网IP和私网IP 有什么区别？

一、查询我们分别在百度搜ip查询，查询到本机的ip如左图，再利用ipconfig查询到自身ip如右图。我们能看到这两个地址是不同的，那么不是说，每个主机都只有一个ip地址么，为什么我们查到的两个Ip地址不一样呢&#xff1f…

阅读更多...

AI开源路在何方丨2023智源大会精彩回顾

AI开源路在何方丨2023智源大会精彩回顾

导读当下，AI开源已经成为了人类开源创新的主战场，是超大规模人类智力协同的最佳组织形式。得益于开源协作持续不断地推进，AI在这个时代飞速发展。可以说如果没有开源社区建设，就不会有今天人工智能的成就。在2023智源大会AI开源…

阅读更多...

洞见数字时代的创新原力，数云原力大会暨 2023TECH 第五届数字中国技术年会开幕

洞见数字时代的创新原力，数云原力大会暨 2023TECH 第五届数字中国技术年会开幕

4 月 25 日，神州控股、神州信息、神州数码集团共同主办的数云原力大会暨 2023TECH 第五届数字中国技术年会隆重开幕。开幕式上，数百位投身并关注数字技术、数字产业发展的学者、技术专家、从业者、行业用户齐聚一堂，围绕云原生、数字原生、大…

阅读更多...

最新文章

推荐文章