深度学习的发展史和主要应用方向

  • 论深度学习

        笔者对于深度学习有着自己独特的见解…借这个机器学习课程大作业,发表一下我的观点。

        时光荏苒,社会的发展日新月异,越来越多的数据分析师、数据科学家倾向于对某次统计过程的分析进行研究,并把这种统计的模型称之为“人工智能”。没错,人工智能就是一个统计数据的过程。自己在学习的过程中很多时候也会怀疑,现阶段的深度学习理论究竟是不是真正的“人工智能”。

        人类,作为碳基生物,其如椰子般大的大脑却能存储近77TB的权重,并且可以自适应训练,但是我们在做深度学习训练的时候却很容易发现,其一是需要外部庞大的算力去训练模型,其二是训练出来的模型往往达不到人类这样智能化的水准。因此不得不怀疑我们的深度学习理论究竟是否正确,就算我们拥有强大的算力,但是耗费的资源也是庞大的,如果未来能够突破这一点,重新定义人工智能,能够更快速的拟合权重,能够自适应地学习,那我们就会从现在的“弱”人工智慧时代进入“强”人工智能时代。

       2023年2月,美国OPENAI公司发布了一款名为CHATGPT的智能对话聊天机器人,一经发布,火爆全网。该产品不仅能够智能完成各种写作任务,甚至能一定程度上替代“码农”。在我看来,CHATGPT一定程度上是一次AI应用领域的革新。人工智能的发展史其实是曲折的,一直到现在,即便是前沿科学家,或许也并不知道在训练的过程中,这些权重干了些什么事情。
       1943年,神经科学家麦卡洛克和数学家皮兹在《数学生物物理学公告》上发表论文《神经活动中内在思想的逻辑演算》。该文中,两位科学家建立了神经网络数学模型,称之为MCP模型。该模型其实就是按照生物神经元的结构和工作构造出来的一个抽象和简化的模型,也由此打开了人工神经网络的大门。MCP模型原理如图1所示。

图1 MCP模型原理图

1958年,计算机科学家罗森布拉特提出了两层神经元组成的神经网络,称之为“感知器”(Perceptrons)。第一次将MCP用于机器学习分类。“感知器”算法算法使用MCP模型对输入的多维数据进行二分类,且能够使用梯度下降法从训练样本中自动学习更新权值。1962年,该方法被证明为能够收敛,理论与实践效果引起第一次神经网络的浪潮。

1969年,美国数据科学家,以及人工智能先驱Marvin Minsky提出感知机本质上是一种线性模型,只能处理线性分类,如果数据任务变成了非线性关系,那么连最简单的亦或问题都无法正确分类。这次提出,等于宣告了感知机的错误,因此人工智能的研究也陷入了近20年的停滞。

       1986年,神经网络之父Geoffrey Hinton在1986年发明了适用于多层感知机的BP神经网络,并采用Sigmoid函数进行非线性映射,该方法的出现,掀起了人工智能的第二次浪潮。对于sigmoid函数,其实就是把数据映射到概率。

 S\left ( x \right )=\frac{1}{1+e^{-x}}

       1991年BP算法被指出存在梯度消失的问题,也就是说在误差梯度后项传递的过程中,后层梯度以乘性方式叠加至前层,因此无法对前层进行有效学习,这个问题直接阻碍了深度学习的进一步发展。


       同年代,支持向量机等各类机器学习模型被提出,SVM是一种有监督学习模型,以统计学为基础,与神经网络存在明显差异。其原理如图2所示。

 图.2支持向量机原理图

    2011年,ReLu激活函数的提出,能够有效的抑制梯度消失问题。

    2012年,Hinton课题组,首次参加ImageNet图像识别比赛,通过其构建的CNN网络AlexNet一举夺得冠军,也正因这次比赛,我们常听到的卷积神经网络引起了更多的数据科学研究者的重视。其AlexNet原理如图3所示。

图.3 AlexNet模型原理图

    2015年,清华大学毕业生、FAIR研究科学家何恺明在ImageNet图像识别大赛中,采用“深度残差学习”系统,击败谷歌、英特尔、高通等业界团队,荣获第一,他也是AI领域研究者的中国代表之一。深度残差系统是一种影响深远的网络模型,一方面是残差网络更好的拟合分类函数以获得更高的分类精度,另一方面是残差网络如何解决网络在层数加深时优化训练上的难题。其原理图如图4所示。

图.4 Resnet 2015原理图
    2017年Google发表论文《Attention is All You Need》提出了一种心的神经网络架构,Transformer,仅仅依赖注意力机制就可以处理序列数据,从而抛弃了RNN、CNN等模型。这个新的网络结构,刷爆了各大翻译任务,目前火热的CHATGPT也正是以Tansformer为基础的大语言模型。其原理图如图5所示。

图.5 Transformer结构原理图

    其实大致的主干AI研究历程应该就是上面所讲,还有一些偏应用的研究历程,比如图像识别、目标检测、NLP、语义分割等。

    目标检测,目前常用的深度学习模型是YOLO系列,由于特征信息和评价指标等问题,该类任务仍然存在很多难点与挑战。

  1. 检测目标尺寸很小,导致占比小,检测难度大
  2. 检测目标尺度变化大,网络难以提取高效特征
  3. 待检测目标所在背景复杂,噪音干扰严重,检测难度大
  4. 检测目标与背景颜色对比度低,网络难以提取出具有判别性的特征
  5. 各待检测目标之间的数量极度不均衡,导致样本不均匀
  6. 检测算法的速度与精度难以取得良好平衡

        NLP,用自然语言与计算机进行通信,这是人们长期以来所追求的。因为它既有明显的实际意义,同时也有重要的理论意义,人们也可通过它进一步了解人类的语言能力和智能的机制。目前最新的进展就是以前文中所提到的Transformer模型为基础,进行训练。
        语义分割,图像语义分割,它是将整个图像分成一个个像素组,然后对其进行标记和分类。特别地,语义分割试图在语义上理解图像中每个像素的角色。实际上就是每个图像中都包含一定的语义信息,然后你通过模型训练,预测图像中不同类别事物的语义信息进行标记不同的颜色,常用的语义分割模型有FCN、U-Net模型等。为了便于理解,展示其中的效果图如图6和图7所示。


图.6原始图

图.7语义分割图

    对于AI的研究,本文就讨论上述内容,希望能帮助大家更好的理解现阶段AI的发展历程以及AI的主要研究方向。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/68227.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Lean — 优秀好用的开源量化交易平台

Lean 是 QuantConnect 开源的一款非常强大的开源量化交易平台,可以回测或运行Python或者C#写的策略,并在代码仓库中内置了上百个C#和Python的策略算法。 这个开源的算法交易引擎,专为让用户方便轻松地进行策略研究、回测和实时交易而构建。它…

python 飞翔的小鸟

mainvoid #音效存放picture #图片存放need #各种计算相关的函数play.py #运行db.db #数据库loadding.py #对图片进行加载下面为主逻辑部分 def MainGame(info):#主游戏模块global distance,bird_x,bird_y,mask,tempname , level , default , color inforeal_bgrandom.choice…

PAT 1118 Birds in Forest(并查集)

题目链接:1118 Birds in Forest 原本以为自己代码写得很丑,特别是对每组中头节点的处理时,总感觉自己错了,但是看了好多人写的答案,发现自己代码还算是写的比较漂亮的。注意最后的并集操作啊,就是u 附上一个并查集写…

Python游戏 (胖鸟快飞Flappybird)

python游戏开发:(胖鸟快飞) 利用python提供的第三方库pygame和python的基础语法来开发此款小游戏,此款游戏代码行数不超过100行,即使是初学者也可以轻松的了解。最重要的是,通过此款游戏不仅打结实了pytho…

234树到红黑树

2-3-4 树 1. 2-3-4树的定义 2-3-4树是一种阶为4的B树。它是一种自平衡的数据结构,可以保证在O(lgn)的时间内完成查找、插入和删除操作。它主要满足以下性质: (1)每个节点每个节点有1、2或3个key,分别称为2&#xff…

飞翔小鸟思路及代码

昨天跳着看视频把飞翔小鸟做出来了,下面分享一下我的思路。 先放成品图 和上一篇飞机大战的思路相似: 1.先把窗体做出把背景图放在面板中 2.把游戏背景中地面移动实现 3.把柱子在面板中实现进场及移动 4.把小鸟放在面板中 5.鼠标监听控制小鸟飞行轨…

luogu p4556 [Vani有约会]雨天的尾巴 树上差分,最近公共祖先,线段树合并

命运的选择 题意神一般的过程及题解. 本来有信仰用 m a p map map套 s e t set set跑过去的,结果调了一天都没调出来,时间还比暴力都慢.只好写线段树合并. 题意 给 一 棵 树 , 每 次 用 一 种 颜 色 覆 盖 树 上 一 条 路 径 . 求 每 一 个 点 覆 盖 次 数 最 多 的 颜 色 , 如…

一文详解数字源表

一、数字源表的基本功能 集多种功能为一体的精密测量仪器,主要是测量电气性能 SMU可以当电源,万用表或电源/测量组合. 当电源时: 可编程电压源 可编程电流源 当万用表时: 数字电压表(电流源,输出电流为0,测电压) 数字电流表(电压源,输…

1044 火星数字( ( ఠൠఠ )搞我心态 )【!!常看!!】

火星人是以 13 进制计数的: 地球人的 0 被火星人称为 tret。地球人数字 1 到 12 的火星文分别为:jan, feb, mar, apr, may, jun, jly, aug, sep, oct, nov, dec。火星人将进位以后的 12 个高位数字分别称为:tam, hel, maa, huh, tou, kes, h…

机械制图之图线基础知识

1.图线的型式 1)常用基本图线: 8 种。 粗实线、细实线、细虚线、细点画线、波浪线、细双点画线、双折线、粗点画线。 2)线宽: 粗、细两种。 线宽比2:1 , 粗线宽度优先采用0.5 mm、0.7㎜。 不同的线型具有不同的含义。 2.图线的应用 3.图线的画法 1)同一图样中同…

机械制图哪个软件好用?浩辰CAD机械2021你值得拥有!

浩辰CAD机械 2021不仅能完美兼容主流CAD设计数据,还拥有业内更完备的智能专业设计功能,集机械制图、机构设计和数据管理等功能模块于一体。本篇机械制图CAD教程小编将详细介绍浩辰CAD机械 2021,帮助大家更好地了解和上手这款最新版本CAD软件。…

UML画图工具汇总

最近学习了UML,搜集了一把各类的画图工具以及它们的特点。最后选出我认为最好用的一款工具。 rose 《大象》书里面就是用的这款软件,但是这个貌似要钱,破解版版本很低,界面看起来也比较复古。不推荐。 star uml 挺有名的软件&…

超详细的热图绘制教程(5000余字),真正的保姆级教程

生物信息学习的正确姿势 NGS系列文章包括NGS基础、高颜值在线绘图和分析、转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析 (ChIP-seq基本分析流程)、单细胞测序分析 (重磅综述:三万字长文读懂…

机械制图-画、读组合体的视图

制图是什么?制图就是投影! 依照惯例,雷老师上课前还是带领大家复习了上节课组合体的组合形式和物体分类的知识点,并且讲解了上次作业中需要注意的问题。比如对于涉及弧的问题,一些人没有投影线,一般点和特…

超好用的两款作图工具,用起来~~~

前言 作为程序员,项目开发过程中肯定会需要画一大堆图,原型图、流程图、UML图、思维导图、拓扑图等等,找到一个好工具肯定是能大大提高工作效率,这里就来分享两款我平时用得比较多的画图工具(这不是广告,也不是推广&a…

机械制图——常见的机件表达

文章目录 标准件与常用件1. 螺纹与螺纹紧固件螺纹旋合画法螺栓装配简化画法螺钉装配简化画法双头螺钉装配简化画法六角头螺栓连接画法双头螺柱连接画法开槽圆柱头螺钉连接画法开槽沉头螺钉连接画法 2. 键(平键)3. 销圆柱销圆锥销 4. 齿轮 零件图与装配图…

绘图小能手gunplot

下面的安装过程是在ubuntu20.04上进行的。 安装gnuplot需要依赖lua5.2。所以先安装lua5.2。 安装lua5.2 下载安装包 wget http://www.tecgraf.puc-rio.br/lua/ftp/lua-5.2.0.tar.gz编译安装lua5.2 解压后进入源码目录 make linux sudo make install安装gnuplot gnuplot主…

CAD机械制图入门知识

在计算机技术不断发展的过程中,CAD技术水平也得到了很大的提升,这使得CAD技术在机械制图当中的使用范围越来越大。CAD是常用的制图软件,具有很强的功能性,特别是在3D制图方面CAD有着较强的实用性。 对于大部分的人来说&#xff0c…

机械制图笔记

机械图纸上Φ50H7什么意思? 一般代表直径50的孔,H7的公差在这里是0.025mm/-0mm。 理论值M6的外径就是6毫米,实际上达不到,因为螺纹的尖顶都是圆角,通过查表m6的最大外径是5.92MM,这是基本数值。 机械制图中EQS,表示…

使用MapBox自定义地图

一、什么是MapBox,相对国内地图厂商的优势 MapBox是一家美国的地图厂商,2010 年成立于美国华盛顿,2017 年获得软银 1.64 亿美元 C 轮融资,完全开源的开发工具,帮助您在现有产品中实现灵活、轻量、稳定的地图、搜索、导…