深度学习发展里程碑事件2006-2024

      2006-2024年,深度学习发展经历众多的里程碑事件,一次次地刺激着人们的神经,带来巨大的兴奋。电影还在继续,好戏在后面,期待……

2006年

  • 深度信念网络(DBNs):Geoffrey Hinton与他的学生在《Science》杂志上发表文章介绍深度信念网络(Deep Belief Networks, DBNs),该方法利用无监督预训练来解决深层神经网络训练中的梯度消失问题,有效地训练深层次模型。

2009年

  • 受限玻尔兹曼机(RBMs):Hinton等人对受限玻尔兹曼机(Restricted Boltzmann Machines, RBMs)的研究进一步推动了深度学习的发展,这些模型成为构建深度学习架构的基石之一。

2012年

  • AlexNet:由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton共同设计的AlexNet在ImageNet大规模视觉识别挑战赛中取得了巨大成功,其性能远超之前所有算法,证明了深度卷积神经网络在图像分类任务上的强大能力。

2013年

  • Dropout:Hinton和他的团队提出dropout技术,这是一种防止过拟合的有效正则化手段,在各种深度学习模型中得到广泛应用。

2014年

  • GoogLeNet:Google团队提出了Inception架构,并在ILSVRC竞赛中夺冠,通过多尺度特征融合显著提升了图像识别精度。
  • 递归神经网络(RNNs):长短期记忆网络(LSTM)和其他递归神经网络结构在处理序列数据如语音识别和自然语言处理领域取得了重要进展。

2015年

  • 循环神经网络(RNNs)的进步:随着GPU计算能力的提升,基于RNN的模型如双向长短期记忆网络(Bi-LSTMs)等在文本生成、机器翻译等领域获得更广泛的应用。
  • Generative Adversarial Networks (GANs):Ian Goodfellow等人首次提出了生成对抗网络的概念,这是生成式建模的一种革命性方法,为图像生成和强化学习带来了全新思路。

2016年

  • WaveNet:DeepMind提出的WaveNet模型在音频合成领域取得重大突破,实现了高质量的语音合成。
  • AlphaGo:DeepMind开发的AlphaGo击败了围棋世界冠军李世石,展示了深度学习结合强化学习在复杂策略游戏中的威力。

这一时期标志着深度学习从理论研究到实际应用的成功过渡,许多创新性的深度学习模型和算法不仅在学术界引发热潮,也在工业界催生了一系列人工智能产品和服务的革新。

2017年:

  • AlphaGo Zero:DeepMind发布AlphaGo Zero,这是一个强化学习和深度学习结合的围棋程序,它无需任何人类知识输入,仅通过自我对弈的方式就达到了超人的棋艺水平,这是无监督强化学习的重要里程碑。

  • Transformer模型:Google在论文《Attention is All You Need》中提出了Transformer架构,该架构摒弃了传统的循环神经网络(RNN)用于序列建模,转而采用自注意力机制,极大地提升了自然语言处理任务如机器翻译的性能。

2018年:

  • BERT (Bidirectional Encoder Representations from Transformers):Google推出预训练模型BERT,首次实现了大规模双向Transformer结构的预训练,并在多种NLP下游任务上取得了当时最先进的效果,开启了NLP领域的预训练模型时代。

2019年:

  • GPT-3 (Generative Pretrained Transformer 3):OpenAI发布了GPT-3模型,它是当时参数量最大的预训练语言模型之一,展现出强大的文本生成和理解能力,进一步推动了大模型在NLP领域的应用。

2020年-2021年:

  • Vision Transformer (ViT):谷歌提出视觉Transformer模型,成功将Transformer应用于计算机视觉任务中,打破了卷积神经网络在图像识别领域的主导地位。

  • YOLOv4:实时目标检测算法YOLO系列的一个重要版本发布,证明了深度学习在实时图像分析中的高效性和准确性。

  • GANs发展:生成对抗网络(GANs)及其变体在图像生成、视频生成等任务上的表现不断提升,包括BigGAN、StyleGAN2等。

2022年

  • ChatGPT:虽然ChatGPT是在2022年末推出的,但其影响力一直延续到2024年甚至更远,成为人机交互和对话系统的重大突破,预示着未来智能助手和AI客服的新标准。 
  • DALL·E, CLIP, Codex:OpenAI继续推出了多项基于Transformer的大规模模型,例如能够根据文字描述生成图像的DALL·E,跨模态模型CLIP,以及代码生成模型Codex,这些都在各自的领域内引发了轰动。

2024年

  • Sora:2024年2月16日,OpenAI全新发布的Sora,一个能够将文本转化为视频的先进工具。这一消息迅速在全球范围内引发了震动,人们在社交媒体上用各种语言表达着他们的震惊:现实界限似乎被突破了。

       这一时期还见证了深度学习技术在医疗诊断、自动驾驶、金融风控、虚拟现实等多个领域的广泛应用,并且随着算力提升和数据增长,深度学习模型的规模不断扩大,促使研究者探索更多的优化方法和技术。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/262264.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux系列讲解 —— 【Vim编辑器】在Ubuntu18.04中安装新版Vim

平时用的电脑系统是Ubuntu18.04,使用apt安装VIM的默认版本是8.0。如果想要安装新版的Vim编辑器,只能下载Vim源码后进行编译安装。 目录 1. 下载Vim源码2. 编译3. 安装4. 遇到的问题4.1 打开vim后,文本开头有乱码现象。4.2 在Vim编辑器中&…

宏观视角下的浏览器

宏观视角下的浏览器 Chrome架构线程 VS 进程进程架构 TCP协议IP:把数据包送达目的主机UDP:把数据包送达应用程序TCP:把数据完整地送达应用程序 HTTP请求流程构建请求查找缓存准备IP地址和端口等待TCP队列建立TCP连接发送HTTP请求 服务器端处理…

Apache服务

目录 引言 一、常见的http服务程序 (一)lls (二)nginx (三)Apache (四)Tomcat 二、Apache特点 三、Apache服务的安装 (一)yum安装及配置文件 1.配置…

#11vue3中使用el-dialog展示与关闭交由父组件控制的写法

目录 1、法一:通过defineEmits调用父组件方法 1.1、父组件 1.2、子组件(CONTENT) 2、法二:通过difineExpose暴露子组件属性 2.1、父组件 2.2、子组件(Child) 1、法一:通过defineEmits调用…

WordPress后台自定义登录和管理页面插件Admin Customizer

WordPress默认的后台登录页面和管理员,很多站长都想去掉或修改一些自己不喜欢的功能,比如登录页和管理页的主题样式、后台左侧菜单栏的某些菜单、仪表盘的一些功能、后台页眉页脚某些小细节等等。这里boke112百科推荐这款可以让我们轻松自定义后台登录页…

【Git】:标签功能

标签功能 一.标签操作二.推送远程标签 标签 tag ,可以简单的理解为是对某次commit的⼀个标识,相当于起了⼀个别名。例如,在项⽬发布某个版本的时候,针对最后⼀次commit起⼀个v1.0这样的标签来标识⾥程碑的意义。这有什么⽤呢&…

计算机网络基础之计算机网络组成与分类

计算机网络基础 计算机网络是计算机技术与通信技术发展相结合的产物,并在用户需求的促进下得到进一步的发展。通信技术为计算机之间的数据传输和交换提供了必需的手段,而计算机技术又渗透到了通信领域,提高了通信网络的性能。 计算机网络的…

mysql 自定义函数create function

方便后续查询,做以下记录; 自定义函数是一种与存储过程十分相似的过程式数据库对象, 它与存储过程一样,都是由 SQL 语句和过程式语句组成的代码片段,并且可以被应用程序和其他 SQL 语句调用。 自定义函数与存储过程之间…

10.Halcon形态学膨胀,腐蚀,开运算,闭运算

膨胀:对边界点进行扩充,填充空洞,使边界向外部扩张的过程。 腐蚀:消除物体边界点,使边界向内部收缩的过程,把小于结构元素的物体去除掉. 开运算: 先腐蚀后膨胀的过程称为开运算。 作用 : 去除孤立的小点,毛刺,消除小物体,平滑较大物体边界,同时不改变其面积. 闭运…

【Spring】Spring MVC

目 录 一.什么是 Spring MVC?1.MVC 定义2.MVC 和 Spring MVC 的关系 二.为什么要学 Spring MVC?三.怎么学 Spring MVC?1.Spring MVC 创建和连接综上连接方式: 2.获取参数1.传递单个参数2.获取多个参数3.获取对象4.获取表单参数5.接…

Day17_集合与数据结构(链表,栈和队列,Map,Collections工具类,二叉树,哈希表)

文章目录 Day17 集合与数据结构学习目标1 数据结构2 动态数组2.1 动态数组的特点2.2 自定义动态数组2.3 ArrayList与Vector的区别?2.4 ArrayList部分源码分析1、JDK1.6构造器2、JDK1.7构造器3、JDK1.8构造器4、添加与扩容5、删除元素6、get/set元素7、查询元素8、迭…

论文学习 BioNeRF: Biologically Plausible Neural Radiance Fields for View Synthesis

论文学习 BioNeRF: Biologically Plausible Neural Radiance Fields for View Synthesis 前言简介NeRF介绍BioNeRF位置编码提取感知过滤记忆更新纹理推断损失函数 量化验证总结 前言 虽然我不应该再看NeRF相关的东西了,但是我还是觉得这个论文的题目很有意思&#…

ChatGPT 是什么

文章目录 一、ChatGPT 是什么二、ChatGPT的发明者三、ChatGPT的运作方式四、ChatGPT的技术五、ChatGPT的优势六、ChatGPT的局限性七、ChatGPT的应用八、ChatGPT的未来九、总结 一、ChatGPT 是什么 OpenAI的ChatGPT,即Chat Generative Pre-Trained Transformer&…

Sora来袭,蹭一波AI热潮|GPT · 重点梳理 -- 什么是ChatGPT,能干嘛,怎么用?

课程安排 学习内容 第一章 2024年AI领域最新技术 1.OpenAI新模型-GPT-5 2.谷歌新模型-Gemini Ultra 3.Meta新模型-LLama3 4.科大讯飞-星火认知 5.百度-文心一言 6.MoonshotAI-Kimi 7.智谱AI-GLM-4 第二章 OpenAI开发者大会后GPT最新技术 1.最新大模型GPT-4 Turbo详细介绍…

(done) 什么是特征值和特征向量?如何求特征值的特征向量 ?如何判断一个矩阵能否相似对角化?

什么是齐次方程? https://blog.csdn.net/shimly123456/article/details/136198159 行列式和是否有解的关系? https://blog.csdn.net/shimly123456/article/details/136198215 特征值和特征向量 参考视频:https://www.bilibili.com/video/BV…

HTML5新婚、年会、各种聚会的现场抽奖活动(附源码)

文章目录 1.抽奖平台设计来源1.1 主界面效果1.2 抽奖效果1.3 中奖效果 2.效果和源码配置2.1 动态效果2.2 人员信息配置2.3 奖品信息配置2.4 抽奖音效配置2.5 源代码 源码下载 作者:xcLeigh 文章地址:https://blog.csdn.net/weixin_43151418/article/deta…

【kubernetes】二进制部署k8s集群之cni网络插件flannel和calico工作原理(中)

↑↑↑↑接上一篇继续部署↑↑↑↑ 目录 一、k8s集群的三种接口 二、k8s的三种网络模式 1、pod内容器之间的通信 2、同一个node节点中pod之间通信 3、不同的node节点的pod之间通信 Overlay Network VXLAN 三、flannel网络插件 1、flannel插件模式之UDP模式&#xff0…

Linux网络编程套接字

目录 前言 一、预备知识 1.1 源IP地址和目的IP地址 1.2 区分端口号和进程ID 1.3 TCP协议和UDP协议 1.4 网络字节序 二、socket编程接口 2.1 socket套接字的概念 2.2 socket常见API 2.3 sockaddr结构 三、关于IP和Port的绑定问题 四、编写简单的UDP服务端和客户端 前…

基于Python网络爬虫的IT招聘就业岗位可视化分析推荐系统(完整系统源码+数据库+详细文档)

文章目录 基于Python网络爬虫的IT招聘就业岗位可视化分析推荐系统(完整系统源码数据库详细文档)源码获取在文章末尾项目概述招聘岗位数据爬虫分析系统展示用户注册登录系统首页IT招聘数据开发岗-javaIT招聘数据开发岗-PythonIT招聘数据开发岗-Android算法…

通过Jmeter压测存储过程

一、存储过程准备: 1、建立一个空表: CREATE TABLE test_data ( id NUMBER, name VARCHAR2(50), age NUMBER ); 2、建立一个存储过程: CREATE OR REPLACE PROCEDURE insert_test_data (n IN NUMBER) AS BEGIN--EXECUTE IMMEDIATE truncat…