一、深度学习的基本介绍

机器学习的基本步骤:

前馈运算、反向传播计算梯度、根据梯度更新参数值。

一、定义及基本概念

        深度学习,就是一种利用深度人工神经网络来进行自动分类预测学习的技术。它可以从海量的数据中自动学习,找寻数据中的特征。所以说,它的本质就是自动提取特征的能力。

        可以说,深度学习就等于深度人工神经网络。

        一般认为超过三层的神经网络就可以叫做深度神经网络。

        深度学习属于一种特殊的人工智能技术。

 反向传播算法:

此算法是人工神经网络中的关键性技术。它可以精确地调整人工神经网络出现问题的部件,从而快速降低网络进行分类或预测的错误率。因此,反向传播算法是人工神经网络的核心。

        在应用层面,深度学习的最大特点是能处理各种非结构化数据,如文本、图片、音频、视频等。 

        一般的机器学习更适合处理结构化数据。

结构化数据:可以用关系型数据库进行存储、管理和访问的数据。

        影响深度学习的3个因素:大数据深度网络架构(算法)GPU(算力)。 

二、深度网络架构

 人工神经网络

        也被称为通用拟合器,因为可以拟合任意的函数或映射。它是一种受人脑的生物神经网络启发而设计的计算模型,非常擅长从输入数据和标签中学习映射关系,从而完成预测或者分类问题。

        它类似于生物神经网络,由人工神经元构成。每个神经元则由简单的数学模型来模拟生物神经细胞的信号传递与激活。

通用逼近定理Universal Approximation Theorem:

用有限多的隐含神经元可以逼近任意的有限区间内的曲线。

深度网络架构

        就是整个网络体系的构建方式和拓扑连接结构,主要有3种:前馈神经网络、卷积神经网络和循环神经网络

1、前馈神经网络

        也叫全连接网络fully connected neural network,是目前最常用的一类神经网络。在这种结构中,所有的节点都可以分为一层一层的,每个节点只跟它的相邻层节点而且是全部的节点相连接。

        这些层一般分为输入层输出层,以及介于两者之间的隐含层

        隐含层可以包含多层,这样就构成了深度神经网络。

隐含层的神经元个数根据我们对数据复杂度的预估决定,通常,数据越复杂,数据量越大,需要的神经元就越多。但是,神经元过多也容易造成过拟合。

       神经网络的运行通常包括前馈的预测过程(或叫决策过程)和反馈的学习过程 

前馈的预测过程:

  1. 信号从输入神经元进入,沿着网络连边传输,每个信号都会与连边上的权重w相乘,得到隐含神经元的输入;
  2. 接着,隐含神经元对所有连边输入的信号进行汇总求和,经过一定地处理后输出;
  3. 这些输出的信号再与从隐含层到输出层的那组连线上的权重相乘,这样就得到了输入给输出神经元的信号;
  4. 然后,输出神经元对每一条输入连边的信号进行汇总,加工处理后输出。
  5. 最后的输出就是整个神经网络的输出。

神经网络再训练阶段会调整每条连边上的权重w的数值。

反馈的学习过程:

  1. 首先,每个输出神经元会计算出它的预测误差;
  2. 然后,将这个误差沿着神经网络的所有连边进行反向传播,这样就能得到每个隐含层神经元的误差;
  3. 最后,根据每条连边所连接的两个神经元的误差重新计算出连边上的权重数值,从而完成神经网络的学习与调整。

        前馈(feedforward)是指网络的传播方向是单向的。具体地说,先将输入信号传给下一层(隐含层),接收到信号的层也同样传给下一层,然后再传给下一层⋯像这样,信号仅在一个方向上传播,最后直到输出层。
        虽然前馈网络结构简单、易于理解,但是可以应用于许多任务中。不过,这种网络存在一个大问题,就是不能很好地处理时间序列数据(以下简称为〝时序数据”)。更确切地说,单纯的前馈网络无法充分学习时序数据的性质(模式)

        于是,循环神经网络便应运而生。

2、卷积神经网络

    一般用于处理数字图像。它可以使原始图像即使经历平移、缩放等变换后仍然具有很高的可识别性。因此,它被广泛应用于计算机视觉、图像识别、图像生成等领域。(深度学习——卷积神经网络(CNN)简介_cnn深度神经网络_南方惆怅客的博客-CSDN博客https://blog.csdn.net/johnny_love_1968/article/details/117636049?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522168308183316800184167936%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=168308183316800184167936&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~top_positive~default-4-117636049-null-null.142%5Ev86%5Einsert_down1,239%5Ev2%5Einsert_chatgpt&utm_term=%E5%8D%B7%E7%A7%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C&spm=1018.2226.3001.4187

3、循环神经网络

        RNN:Recrurrent Neural Network

       它的网络结构和前馈神经网络很相似,但RNN的隐含层彼此之间有连接

        RNN的这种架构使得网络当前的运行不仅跟当前的输入数据有关,还与之前的数据有关。所以,RNN适合处理语言、音乐、股票曲线等时间序列类型的数据,它被广泛地应用于自然语言处理。RNN网络的循环结构可以应付输入序列中存在的长程记忆性和周期性。

训练方式也会影响深度网络的学习:

  • 如果我们将少量有特定标签的数据输入网络,然后拿剩下的数据去训练它,就会比一股脑儿地把所有标签的数据都输入给它要更加有效,这种方式可以提高深度网络的“学习”能力,让其像人类一样学习。
  • 还可以通过迁移学习将训练好的神经网络迁移到新的小数据集中,从而提高其学习能力。

  三、GPU加速神经网络训练

        图形处理单元Graphics Processing Unit。和CPU一样是做计算的基本单元,只不过GPU是嵌在显卡上的,CPU是嵌在主机主板上的。

        GPU可以帮助深度神经网络的计算加速,因为GPU非常擅长于大规模的张量(高阶矩阵)运算,并且为这种运算加速,包含多个数值的张量运算所需要的平均时间远少于对每个数字运算的时间。

        最开始,GPU的发明是为3D电子游戏的3D图像渲染,因为3D图像渲染需要进行大规模的矩阵运算,GPU可以使这种运算并行化,让计算机图形渲染的画面更流畅和光滑。

        后来,人们发现深度神经网络的训练运算过程可以全部转化为高阶矩阵(一般叫张量)的运算过程,所以GPU的矩阵运算并行化可以加速神经网络的训练。      

四、特征学习

        Feature Learning。

        把不同的信息表达到不同层次的网络单元(权重)之中,并且这一过程不需要手动干预,全靠机器学习自动完成。

五、迁移学习

        Transfer Learning

        把一个训练好的神经网络迁移并拼接到另一个神经网络上,然后用前面部分的神经网络进行特征提取,再将这个特征提取器与后面的神经网络进行拼接,后面部分的神经网络会根据这些特征进行分类或者预测,去解决另一个完全不同的问题。

        特征提取迁移学习,使我们能够实现各种端到端(end to end)式的学习。即是可以直接输入原始数据,让深度网络输出最终的结果即可。之余中间的处理环节,我们都不关心,因为整个深度网络会自动学习到一种最优的模式,从而使模型可以精确地输出预测值。

        这种端到端的学习方式有个优点:它可以通过不断吸收大量数据而表现得越来越专业,甚至在训练神经网络的过程中不需要所解决问题的领域知识。

六、深度学习取得成功的原因

  1. 深度神经网络可以自动学习特征,避免了大量的人工工作,使得端到端的机器学习成为可能;
  2. 可以对深度神经网络实施类似于脑外科手术的迁移和拼接,这不仅实现了利用小数据完成高精度的机器学习,也让我们的深度神经网络能够像软件模块一样拼接和组装。

七、深度学习术语

1、模型

对数据预测原理的基本假设。

2、拟合

将模型应用到训练数据上,并试图达到最佳匹配的过程。

欠拟合

        模型没有很好地捕捉到数据特征,不能很好地拟合数据。即高偏差,低方差。

过拟合overfitting

        模型可以在训练数据上进行非常好的预测,但在全新的测试数据上表现不行。

        模型把数据学习得太彻底,以至于把噪声数据的特征也学习到了,这样会导致在后期测试的时候不能很好地识别数据,即不能正确地分类,模型泛化能力太差。即低偏差,高方差。

泛化能力

        机器学习的目标是使学得的模型能够很好地适用于新的样本,而不是仅仅在训练样本上工作得很好,学得的模型适用于新样本的能力称为泛化能力。

3、特征变量

特征变量构成了模型的自变量集合,然后根据数据中的这些特征变量来进行预测。

4、目标标量

是模型去拟合的目标。

5、参数

通过调整参数来改善拟合效果,参数越多,往往拟合得越准,但是也容易引起过拟合现象。

6、损失函数

衡量模型质量的损失函数,用平均误差、交叉熵或者似然函数,它通常是目标变量和模型预测值的函数,然后根据损失函数来优化模型,求出最优参数组合。

7、训练

反复不停调整模型中参数的过程

8、测试

检验已经训练好的模型的过程。

9、样本

每一个数据点就叫做一个样本

10、训练集

用于训练模型的数据集合

11、测试集

用于检验模型的数据集合

12、梯度下降算法

根据梯度信息更新参数的算法,简单且有效。

13、训练迭代

反复利用梯度下降算法的循环过程。

14、超参数

对于一个神经网络,网络每层的神经元个数就是超参数。超参数与参数的区别是参数会在训练中调节,而超参数不会。

15、变量

类型变量:这个变量可以在不同的类别中取值,比如星期这个变量,取值是1,2,3,4,5,6,0。它的大小没有任何翻译,只是为了区分不同的类型而已。

数值变量:这类变量会从一个数值区间连续取值,比如湿度、温度、风速。

数值类型的变量是每个变量的变化范围都不一样,单位也不一样,所以,不同的变量不能比较。解决方法是对此类变量进行标准化处理,也就是用变量的均值和标准差来对该变量做标准化,从而把特征数值的平均值变为0,标准差变为1.

16、批处理

当数据量过多的时候,采用批处理batch processing的模式,就是将所有的数据划分为一个批次大小batch size的小数据集,然后在每个训练周期给神经网络输入一批数据。批次的大小按照问题的复杂度和数据量的大小而定。

八、神经网络的学习训练与运行

        只要调节神经网络中各个参数的组合,就能得到想要的任何曲线。而这些参数是通过训练得来的。

        要想完成神经网络的训练,首先要给这个神经网络定义一个损失函数用它来衡量神经网络在现有的参数组合下输出的表现如何。

        神经网络要学习的就是神经元之间的连边上的权重偏置,而学习的目的就是得到一组能够使神经网络总误差(损失函数)最小的参数值组合。

        降低总误差其实是一个求极值的优化问题,用高等数学里的方式就是求导,让导数等于零就行。但是实际中的神经网络包含了大量的非线性运算,无法直接用求导数的方式。

        因此,采用梯度下降算法来求解。此算法的每次迭代都向梯度的负方向前进,使误差值逐步减小。

        参数的更新则需要用到反向传播算法,将损失函数沿着神经网络一层一层地反向传播,来修正每一层的参数。

PyTorch中的反向传播算法就是函数backward(),只要执行该命令,PyTorch就会自动执行反向传播算法,计算出每一个参数的梯度,然后根据这些梯度信息更新参数即可,这样就完成了一个学习过程。

神经网络的学习和运行是交替进行的。 即,在每一个周期内,神经网络都会进行前馈运算,从输入端到输出端,然后根据输出端的损失值(误差值)来进行反向传播算法,从而调整更新神经网络上的各个参数。只要不停地重复,就可以让神经网络学习得越来越好。

语言模型:language model

        语言模型 给出了单词序列发生的概率。具体来说,就是使用概率来评估一个单词序列发生的可能性,即在多大程度上是自然的单词序列。比如,对于“you say goodbye” 这一单词序列,语言模型给出高概率(比如 0.092):对于“you say good die' 这一单词序列,模型则给出低概率(比如 0.000 000 000 0032 )。
        语言模型可以应用于多种应用,典型的例子有机器翻译和语音识别。比如,语音识別系统会根据人的发言生成多个句子作为候选。此时,使用语言模型,可以按照〝作为句子是否自然〞这一基淮对候选句子进行排序。
        语言模型也可以用于生成新的句子。因为语言模型可以使用概率来评价单词序列的自然程度,所以它可以根据这一概率分布造出(采样)单词。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/61594.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

安卓系统主板链接USB声卡,卡号配置和授权说明

工作中,我们可能会经常遇到不同的声卡主板和系统主板,尤其是在chatGPT 当下正热门的情况下,开发测试语音功能,少不了要用到不同的主板和USB声卡。下面以3399和讯飞声卡配置简单说明下配置方法和步骤: 1、准备工作&…

chatgpt赋能python:如何用Python实现Uno主板烧录

如何用Python实现Uno主板烧录 简介 Arduino Uno是一款基于Atmel AVR处理器的单板微控制器,常用于制作物联网设备、机器人和互动艺术等项目中。在开发过程中,需要将程序烧录到Uno主板上,这样才能让主板运行我们设计的程序。本文将介绍如何使…

为什么 C# 可能是最好的第一编程语言

纵观神州大地,漫游中华互联网,我看到很多人关注为什么你应该开始学习JavaScript做前端,而对blazor这样的面向未来的框架有种莫名的瞧不起,或者为什么你应该学习Python作为你的第一门编程语言,恕不知有多少公司业务是用…

微软CEO纳德拉:AI是人类大脑的加速器

微软CEO纳德拉:AI是人类大脑的加速器! 微软首席执行官(CEO)萨提亚纳德拉日前驳斥了特斯拉创始人埃隆马斯克有关微软控制OpenAI的说法。在接受CNBC采访时,纳德拉表示,马斯克的说法“实际上是不正确的”。他强…

冠达管理:A股大涨后缩量蓄势整固 房地产产业链持续活跃

周三,A股在周二大涨后蓄势整固,三大指数均小幅跌落。昨日商场调整压力主要来自以CPO为代表的AI主线回调;周二领涨的地产股连续强势,基建、城镇化概念股走势活跃;另一领涨主线券商股则略微回落。此外,化工化…

亲戚3.5W入职华为后,我也选择了转行……

我是汽修专业,大学毕业后做了汽车销售,后又转到房产销售,有苦又累,还被冷嘲热讽 …… 学科 | Python大数据开发 校区 | 郑州校区 故事的背景 大家好,我就是故事的男主角。我是对口升学大专生,学习了四年…

水羊转债,超达转债,晓鸣转债上市价格预测

水羊转债 基本信息 转债名称:水羊转债,评级:A,发行规模:6.94987亿元。 正股名称:水羊股份,今日收盘价:13.94元,转股价格:13.71元。 当前转股价值 转债面值 /…

用AkShare获取实盘沪深可转债数据

可转债(英文翻译:convertible bond、convertible debenture或convertible note)。指公司发行的含有转换特征的债券。在招募说明中发行人承诺根据转换价格在一定时间内可将债券转换为公司普通股。转换特征为公司所发行债券的一项义务。可转换债…

【可转债,股票】低频量化之 可转债 配债价格表

目录 待发配债-5批文通过待发配债-4发哥通过待发配债-3交易所受理待发配债-2股东大会通过待发配债-1董事会预案最后 待发配债-5批文通过 代码名称张数股数成本688268华特气体*#0.620015128.0688268华特气体*#1.630022692.0688268华特气体*#2.648736836.7688268华特气体*#3.6674…

会通转债,大元转债上市价格预测

会通转债 基本信息 转债名称:会通转债,评级:AA-,发行规模:8.3亿元。 正股名称:会通股份,今日收盘价:8.61,转股价格:9.33。 当前转股价值 转债面值 / 转股价格…

通达信接口下如何获取可转债品种。

在通达信接口下运行量化策略需要建立自己的标的池,从符合条件的池子里进行筛选出可执行策略的具体标的。 下面简单和大家说一下如何获取关于可转债的数据。 以下是查询可转债的参数组:可以根据各项指标去获取来建立自己的池子,例如财务报表&a…

熊猫头动画人物表情、场景图片、物品抠图等等动画素材总共60GB

正文: 沙雕动画目前非常的火爆,有很多的博主都在用这些相关的资源, 如果你也有过这样的想法,那么好巧。 我知道你缺素材! 分享一波自己在某宝花Q的沙雕动画素材及教程,包含了CTA、PS、AI、Flash等相关文件素材&a…

宝塔面板+轻松部署一款二次元的Web多人在线网络聊天系统fiora聊天室

前言 Fiora是一款偏二次元的Web多人在线聊天应用,是使用Node.js、Mongodb、Socket.io和React编写的,使用起来简洁、方便,在这里使用宝塔面板Fiora安装教程分享给大家。 对于不懂各种程序,不通各类代码新手来说,用宝塔来…

a洋发卡网sadnt模板美化

介绍: 优化了手机模板商品图片以及一些花里胡哨的构造 源码直接替换sadnt模板里面的index.php就行.建议先备份! 网盘下载地址: http://kekewangLuo.net/p4YJHDSfrVc0 图片:

Typecho 免费“魔改官方”模板

这一款主题是基于官方提供的默认模板进行二次魔改,相较于默认模板外观存在很大的改观。 这款主题样式非常的简单,外观也非常简约,没有那么多的各种特效。 重要提示:禁止修改删除版权信息(前台的主题版权信息可以删除&a…

图像超分——Real-ESRGAN快速上手

契源 想必每个自媒体行业从业者都面临过这样一种情况:从网络上找到一张素材做封面,然而素材图片往往太模糊。那么,有没有办法对其进行高清修复呢?这就是计算机视觉领域的子领域图像超分所研究的主要问题。 在我的专业课上&#…

【每周CV论文推荐】基于GAN的图像数据增强有哪些经典论文值得阅读

欢迎来到《每周CV论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。 当前基于GAN的二维图像生成领域的发展已经非常成熟,GAN不仅可以用于从零生成图像数…

移动互联网社交江湖已定,抖音为何仍不放过微信?

进入2023年,抖音集团依然放不下“社交梦”。 2022年12月30日,抖音官网上线了一款名为“抖音聊天”的桌面端聊天软件,提供Windows和Mac两个版本,进入软件需使用抖音App扫码登录。 这并不是抖音集团首次推出社交产品。2019年以来&am…

抖音为什么这么火,从运营角度分析它的优缺点!

抖音竞品分析报告详见公众号文章:https://mp.weixin.qq.com/s?__biz=Mzg3MjA0MTg0OA==&mid=2247484702&idx=1&sn=1f346c39a2dfc796a60676ca7231a12e&chksm=cef41909f983901fc79e44ebdce8800f3907b90f48f1aeb35cd7aa04a3a95dd4d2a1d57fd4c6&token=1078838…

抖音推出聊天软件

最近,抖音又在折腾社交了,从抖音官网获悉,日前,抖音推出桌面端聊天软件“抖音聊天”,支持Windows、Mac双端,版本号为1.0.0。 想下载体验的小伙伴直接在公众号后台回复:“抖音聊天”。 我下载下来…