百万网友AI导师李沐离职投身大模型,B站“组会”还会有吗?(文末赠书)

目录

  • 1 求学之路:全能学霸
  • 2 AI之路:与深度学习结缘
  • 3 一战封神:亚马逊首席科学家
  • 4 动手学习深度学习


前阵子“沐神”李沐离开亚马逊、加入创业公司BosonAI的消息,引起了业内比较广泛的讨论。

在这里插入图片描述

而BosonAI的创始人正好是他的博士生导师亚历克斯·斯莫拉(Alex Smola),还在建设的官网信息显示公司是做AI大模型方向的研究。看来ChatGPT的爆火让人们意识到,加大模型、加多参数的效果着实惊人,很多人都跃跃欲试准备大展身手。

他本人则在B站表示,去年12月已经提了离职

在这里插入图片描述

李沐备受关注,除了机器学习领域顶级大佬身份之外,他还一直身体力行、平等地向更多普通人分享传递技术知识,名气更盛非常出圈。

比如他在B站开设的各种机器学习课程与精读论文等视频,就有1700多万人次观看!大家每次打开B站视频就像开组会一样,收获满满。

而他之所以被称为“沐神”,答案就藏在那“开挂”般的求学、职业之路中。

在这里插入图片描述

1 求学之路:全能学霸

李沐还不是“沐神”的时候,就已经在上海交通大学留下了“沐哥”的传说。

他一直很喜欢数学,但在上大学前并没有过多接触计算机。还好上交大ACM班能很好地让他发挥强大的数学能力,作为学霸他面对海量代码练习也丝毫不怵,学习之外在球场上、游戏中更是属于“大神”级的人物,大学阶段过得可谓风生水起。

正是这种既能在智商上碾压众人,又能在游戏、运动等方面高人一等的表现,让“沐哥”这一称号留在了上海交大。硕士研究生阶段,他依然在上海交大度过。

正是在ACM班,李沐初次接触人工智能(AI),并推开了那扇他以后在其中大有作为的AI世界大门。尽管彼时计算机已经是一个非常好就业的行业,但秉承着ACM班“培养计算机科学家”的理念,他毕业后选择继续学习AI,到香港科技大学进修了一年。

2011年,他尝试申请了一些美国名校的博士,但收到的offer并没有特别合适的导师,就受邀投奔百度的师兄戴文渊了。

在百度商务搜索部门,他主要使用机器学习来预测一个广告是不是会被用户点击。不同于学校的实验室,百度拥有更多的硬件资源和数据,让他能够大显身手尝试各种算法与模型,有时候为了5%的性能提升要写上千行代码。

尽管这种行为有着过度设计的意味,但深入研究细节对他个人能力的提升是巨大的,在项目中遭遇到的一些问题也成为他日后研究的方向之源。

那时候深度学习才刚出来不久,但他总觉得这一技术可能是大规模机器学习的未来,一直深切关注着。

李沐打造的这套系统最后上线,在百度广告流量中发挥了巨大的作用。

2 AI之路:与深度学习结缘

2011年年底,他现在的妻子被麻省理工学院(MIT)录取,为了不异国恋,他顺手给MIT和卡内基梅隆大学(CMU)寄了博士申请资料,然后收到了CMU的offer。

那时候他还有点纠结要不要去,在得知机器学习大佬亚历克斯·斯莫拉将要去CMU任职后,便下定了决心:去!

在这里插入图片描述
2012年8月,李沐早上在百度开完会,中午办完离职就直奔机场。空中旅程完毕在匹兹堡落地后,他既不知道CMU该怎么走,也没有找到住的地方,可谓和他对未来的感受一样:一片迷茫,但充满乐观。

后来到了学校上课的时候,他的导师亚历克斯·斯莫拉还在谷歌任职,就把他扔给了分布式领域大佬大卫·安德森(Dave Andersen)。就这样,他一边学习分布式系统,一边学习机器学习。

第一年他最大的收获来自课程“高级分布式系统”,“读然后讨论论文”的上课方式让他受益匪浅,因为那不仅是关于知识,还有很多是对设计理念的领悟。精读论文也成为他日后向大家分享知识的一种方式。

后来学习逐渐进入正轨,李沐在两位大佬的指导下迅速成长,在机器学习和分布式系统上有了自己的理解,但有些想法似乎并不能被大家接受。

当时他们的一项工作是关于如果划分数据和计算使得减少机器学习求解中的网络通信量,在找到一个较好的算法并用了两个月去优化、分析然后把论文写出来之后,却发表无门。

在谷歌实习期间,他尝试用用户的GPS数据进行用户行为建模,但当时隐私问题刚好处于风口浪尖,写的文章删了一大半才得以在谷歌发表。

后来他又基于在百度期间写的算法做了分析和改进,写的一篇关于分布式下不保证数据的及时性来提升系统性能的文章,被NIPS(Conference and Workshop on Neural Information Processing Systems,神经信息处理系统大会)拒绝了。

他有些沮丧,又碰上一门听不太懂的机制设计课程,压力山大。

3 一战封神:亚马逊首席科学家

在导师的指导下,他在写作和报告上花了更多心思,文章才在计算机顶级会议OSDI(Operating Systems Design and Implementation,操作系统设计与实现研讨会)和NIPS上发表。

情况有了好转,李沐安下心来做自己想做的事情。

然后他加入了百度的“少帅计划”入坑深度学习,着手从CXXNet开始研究分布式深度学习框架,跑一些Alexnet之类的实验。后来CXXNet发展到虽然能用但灵活性不足,李沐就牵头把它和另一个项目结合在一起,成立了MXNet项目。

MXNet项目进展非常顺利,很快开源发布并获得了不错的反响,在当时人人讲深度学习的情况下备受关注。后来媒体的吹嘘报道和一片点赞声让他有些飘飘然,但也迅速警醒:相比简单的吹嘘,真诚的分享更重要。

他开始认真地向大家分享干货知识,“沐神”之称也逐渐普及。

尽管当时TensorFlow的开源让他倍感压力,但也让他领悟到一点:与其过分关心和担忧对手,不如把精力集中在自己做得更好。

2016年年底,在MXNet开源一年后,亚马逊宣布正式将它作为官方使用的深度学习框架。

亚马逊的支持让李沐和团队的压力少了许多,也加快了MXNet的发展和推广。为了让MXNet发展得更好,他投桃报李地去了亚马逊兼职开发MXNet和AWS上深度学习的应用。

“沐神”在学术与应用上都积累了丰富的经验与人脉资源。

后来在他博士答辩委员会成员中,既有谷歌、亚马逊和苹果的AI负责人,又有他兼职公司的领导人,都是从学术界跑到工业界的AI大佬。

在得知他想继续在学术界发展的时候,大佬们纷纷指出:搞学术又忙又穷,跟我们干,有钱!

其实在毕业之前,他也从学术界去往工业界参与过创业,拿了几十万的天使投资就和导师们干得风风火火,后来被一个上市公司看中并收购了。但因为理念不一致,他们陆续退出了,创业体验卡到期。

思来想去,最终他选择了亚马逊。

彼时亚马逊的人工智能部门成立不久,正是MXNet大放异彩的时候,李沐的机器学习经验更是大有作为。

与之前单搞技术不同,随着他的能力增长,亚马逊对他的责任期望也越大,他开始关注团队与产品。还好他为此做好了准备,并且给出了一份非常好的答卷,最终成为亚马逊的首席科学家。

他在总结自己工作5年的时候,只用了一句话:专注最有价值的事情。他认为对一件事的价值认识不能局限当下,要放眼未来。在对未来逐渐有把握的时候,调动资源专注到那一件事上,然后把它做好。

如果一生中能做好几件有着极大价值的事,那也就值了。

从上海交大ACM班到CMU博士,从百度到亚马逊,李沐从初窥AI门径,到开发深度学习框架MXNet,慢慢成为AI领域举足轻重的机器学习科学家。

“沐神”之称名副其实。

4 动手学习深度学习

当然“沐神”并不是一开始就全能,在早期发布MXNet的时候他就经常被吐槽文档写不好。

但他并没有逃避短板,而是痛定思痛把部分做技术的时间挤出来写文档,就是为了让大家能更轻松地读懂技术,然后去使用。

在这种情况下,《动手学深度学习》横空出世,并成为现在200多所大学的相关课程教材。

有得必有失,占据了研发的时间去写文档,MXNet的性能与易用性就缺乏更好的提升,以至于没有做到领域前二。

也许从用户价值上来说产品可能大于教材,但从教育价值上来说教材是大于产品的,很难直接说两者孰轻孰重。

不过对“沐神”B站近50万粉丝和广大关注他的人来说,教材、教程的价值肯定是大于一个深度学习框架的。

在这里插入图片描述
好的教程与教材对大家学习的效率提升效果不言而喻,这也是无数粉丝亲切地叫“沐神”为导师的缘故。

在这里插入图片描述

在PyTorch流行起来有不可挡之势的时候,有很多读者期望“沐神”的《动手学深度学习》出一个相应的版本。现在,《动手学深度学习(PyTorch版)》应声而来。

作为《动手学深度学习》的重磅升级版本,本书不仅选用了PyTorch提升交互式学习体验,更重新修订了所有内容,针对AI技术的发展新增了注意力机制、预训练等内容。

本书不仅降低了学习门槛,让初学者能更快上手,也让理论与技术结合,帮助大家在学理论方法的同时掌握技术落地并可以应用到实际生产中,可谓一举多得。

就像“沐神”在一期视频中所说“GPT时代AI怎么学?动手学就是了!”

在这里插入图片描述

深度学习也一样,动手学就是了。

《动手学深度学习(PyTorch版)》不仅能让我们在技术层面正确认识GPT,也能更清晰地从发展中掌握一些规律,更好地去适应时代、引领时代,而不是摊手放弃被时代淘汰。

豆瓣评分9.1,相信这本书可以成为大家开始或者深入了解深度学习的入场券。

在这里插入图片描述
本文赠书四本,规则如下

【抽奖方式】

  1. 关注博主,点赞收藏文章,并做出有效评论
  2. 根据评论记录随机抽取4位用户赠送实体图书
  3. 截止日期:7.23日晚8点,届时通过blink公布获奖信息,请中奖用户及时私信

🔥 更多精彩专栏

  • 《ROS从入门到精通》
  • 《Pytorch深度学习实战》
  • 《机器学习强基计划》
  • 《运动规划实战精讲》

👇源码获取 · 技术交流 · 抱团学习 · 咨询分享 请联系👇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20691.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

揭秘 “移动云杯”高校赛道——法律科技创新子赛道

【赛道介绍】 法律科技创新大赛以人工智能、大数据等技术为基础,拓展政法工作现代化中的创新应用,加强科学的方法论和先进的技术手段与传统政法业务的融合,搭建法律科技领域思想、技术、应用的交流实践平台,助推法律科技产业人才培…

资源分享(nlp、kaggle、pytorch、datawhale)

文章目录 一、.机器学习、深度学习库、优秀课程1.1 资源库1.2 优秀课程1.3 优秀作者、公众号 二、NLP相关2.1 NLP相关2.2 transformer资源2.3 Hugging Face:2.4 其它文章 三、CV相关四、数据挖掘4.1 pandas、sns工具类 五、kaggle赛事5.1 NLP赛事 六、 其它赛事&…

chatgpt赋能python:自动填表程序:让烦人的表格填写工作自动化

自动填表程序:让烦人的表格填写工作自动化 随着互联网的发展,填写表格已经成为我们日常生活和工作中不可避免的一部分。不管是在线申请、调查问卷还是财务报表,表格的填写让人感到烦恼而且耗费时间。为了解决填表的烦恼,python的…

chatgpt赋能python:Python如何自动发邮件

Python 如何自动发邮件 Python 是世界上最受欢迎的编程语言之一,Python 可以实现各种各样的功能,自动化发邮件也是其中之一。本文将介绍 Python 的邮件发送库和如何自动发送邮件,希望能为读者提供帮助。 为什么要自动发邮件? 自…

Python某地区二手房房价数据分析

房价数据分析 数据简单清洗 data.csv 数据显示 # 导入模块 import pandas as pd # 导入数据统计模块 import matplotlib # 导入图表模块 import matplotlib.pyplot as plt # 导入绘图模块# 避免中文乱码 matplotlib.rcParams[font.sans-serif] [SimHei] # 设置字体为…

house_price(房价预测)

最近在阅读一些AI项目,写入markdown,持续更新,算是之后也能回想起做法 项目 https://github.com/calssion/Fun_AI Kaggle--House Prices: Advanced Regression Techniques Kaggle address(网址):https://www.kaggle.com/c/house…

kaggle房价预测

通过前面的学习,实战一个房价预测项目,kaggle房价预测,该数据集涵盖了2006-2010年期间亚利桑那州埃姆斯市的房价,包含了很多特征。 导入所需的包 %matplotlib inline import pandas as pd import torch import numpy as np from…

Pandas与ChatGPT的超强结合,爆赞!

来自公众号:数据STUDIO Python Pandas是一个为Python编程提供数据操作和分析功能的开源工具包。这个库已经成为数据科学家和分析师的必备工具。它提供了一种有效的方法来管理结构化数据(Series和DataFrame)。 在人工智能领域,Pandas经常用于机器学习和深…

一个浏览器插件畅享Chat GPT,还有更多实用小组件、高清壁纸

即使chatGPT已经火爆了一段时间了,但它仍然是目前备受关注的话题。而在国内使用需要一定的成本,许多人甚至根本找不到注册的办法,因此也衍生了不少代注册服务。但其实国内也有不少可以体验和chatGPT几乎同样服务的办法,这篇文章就…

docker一键部署网址导航+博客+管理系统(强势开源)

花森门户 码云仓库地址:https://gitee.com/HuaSenJioJio/huasenjio-compose Github仓库地址:https://github.com/huasenjio/huasenjio-compose 📌 关于 花森系列网站增添新作品,(huasenjio-compose)官方仓…

【LLMs】关于LLMs的语义搜索

🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞…

AI_Papers:第一期

2023.02.06—2023.02.12 文摘词云 Top Papers Subjects: cs.CL 1.Multimodal Chain-of-Thought Reasoning in Language Models 标题:语言模型中的多模式思维链推理 作者:Zhuosheng Zhang, Aston Zhang, Mu Li, Hai Zhao, George Karypis, Alex Sm…

基于ChatGPT用AI实现自然对话

1.概述 ChatGPT是当前自然语言处理领域的重要进展之一,通过预训练和微调的方式,ChatGPT可以生成高质量的文本,可应用于多种场景,如智能客服、聊天机器人、语音助手等。本文将详细介绍ChatGPT的原理、实战演练和流程图&#xff0c…

怎样用一周时间研究 ChatGPT

我是怎样用一周时间研究 ChatGPT 的? 上周大概开了 20 多个会,其中有一些是见了觉得今年可能会比较活跃出手的机构,其余见的绝大多数是和 ChatGPT 相关。 我后面就以 ChatGPT 为例,讲下我是如何快速一周 cover 一个赛道的&#x…

走进机器学习

作者简介:本人是一名大二学生,就读于人工智能专业,学习过c,c,java,python,Mysql等编程知识,现在致力于学习人工智能方面的知识,感谢CSDN让我们相遇,我也会致力…

Spring 20年:缔造Java领域神话,近90% Java程序员形影不离

题图 | Image by Freepik 摘要:在编程世界,代码耦合性高、复杂性大的问题一直折磨着所有开发人员。为了解决这个问题,程序员前仆后继开发出了各种框架。但是没有一个特别能打、且让大部分程序员拍手称快的框架诞生。直到有一位年轻但经验丰富…

程序员的三大优点:懒惰、急躁和傲慢

1987 年的今天,Perl 1.0 发布。 今天是 Perl 语言诞生 35 周年。 忽略一下这张图的时间 Perl 语言发明人 Larry Wall 是一位传奇的黑客、一个风趣幽默的人。他的传世名言—— 程序员的三大优点是:懒惰、急躁和傲慢。 在编程圈子的普及程度大概仅次于——…

Qt6教程之三(19) Git版本管理工具

一 Git简介 Git的由来 是一个开源的分布式版本控制系统 ,用于有效、高速的处理从很小到非常大的项目版本管理。 Git 最初是由Linus Torvalds设计开发的,用于管理Linux内核开发。 GitHub是一个基于Git的远程文件托管平台(同GitCafe、BitBucket和GitLab等…

Android中如何使用GPS

Android中如何使用GPS获取位置信息?一个小Demo如下 GPS简介 Gobal Positioning System,全球定位系统,是美国在20世纪70年代研制的一种以人造地球卫星为基础的高精度无线电导航的定位系统,它在全球任何地方以及近地空间都能够提供…

【万字长文】深度解析 Transformer 和注意力机制(含完整代码实现)

深度解析 Transformer 和注意力机制 在《图解NLP模型发展:从RNN到Transformer》一文中,我介绍了 NLP 模型的发展演化历程,并用直观图解的方式为大家展现了各技术的架构和不足。有读者反馈图解方式虽然直观,但深度不足。考虑到 Tra…