深度学习01-概述

深度学习是机器学习的一个子集。机器学习是实现人工智能的一种途径,而深度学习则是通过多层神经网络模拟人类大脑的方式进行学习和知识提取。

深度学习的关键特点:

1. 自动提取特征:与传统的机器学习方法不同,深度学习不需要手动设计特征。传统机器学习依赖人工进行特征工程,而深度学习可以通过算法自动提取特征,从而提高分类、预测等任务的精度。

2. 模仿人脑的结构:深度学习通过使用多层神经网络(Deep Neural Networks)来模拟人类大脑的学习机制,学习数据的深层次特征。

3. 黑箱模型:由于深度学习涉及大量的参数和复杂的网络结构,模型的可解释性较差,因此常常被视为“黑箱”算法。

4. 应用广泛:深度学习广泛应用于图像识别、语音识别、自然语言处理等领域,能够处理大量复杂的非结构化数据。

模型的可解释性差主要是指模型在做出预测或决策时,我们很难清楚地了解其内部的工作机制和每个决策的依据。对于深度学习模型,尤其是深度神经网络,这个问题尤为突出,原因如下:

因此我们在学习深度学习的时候,我们普通人不必要去深究他这个为什么预测好,这个为什么预测差,因为顶尖的科学家,在目前而言也没法解释出来,所以。我们不太注重可解释性,但是深度学习的算法有时候的结果准确率会超过人类。还有一个好处就是,不需要人工的做特征工程的。

1. 复杂的结构:

  • 深度学习模型通常包含多层神经网络,每层可能包含成百上千个神经元和大量的连接权重。随着网络层数的增加,模型的内部结构变得极其复杂。

  • 各层神经元之间的交互和权重的更新过程并不是人类可以直观理解的,这导致我们难以解释为什么某个输入数据导致了某个输出结果。

2. 大量的参数:

  • 深度学习模型通常有成千上万,甚至上百万的参数,这些参数决定了模型的行为。每个神经元的权重更新依赖于复杂的梯度计算,参数之间的相互影响极难追踪和解释。

  • 在这些参数共同作用下,模型得出的决策很难归结为某几个显式的规则或特征。

3. 非线性关系:

  • 深度神经网络利用非线性激活函数,通过多层非线性组合,使得输入和输出之间的关系变得复杂和难以解析。即使我们知道模型的输入和输出,也难以还原出中间的转换过程。

4. 黑箱特性:

  • 深度学习模型中的决策过程被形象地称为“黑箱”,因为虽然我们可以看到输入和输出,但中间的决策过程是高度复杂和不透明的。即使我们通过技术手段可视化某些层或神经元的活动,也很难确切知道它们对最终决策的影响。

5. 缺乏明确的决策规则:

  • 传统的机器学习算法(如决策树)有明确的规则和分支路径,方便人类理解其决策过程。而深度学习则不同,模型通过大量的训练数据自行学习特征和规则,无法直接得出类似“如果X则Y”的明确规则。

6. 高度依赖数据:

  • 深度学习模型的决策过程是高度依赖于数据的。在训练过程中,模型会自适应调整大量的权重参数,从而适应特定的数据集。这意味着同样的模型在不同的数据集上可能学到完全不同的模式,这使得模型的可解释性更加困难。

例子:深度学习在图像分类中的可解释性问题

  • 假设我们有一个用来识别猫的深度学习模型,它输出“是猫”或“不是猫”。虽然我们可以通过测试验证模型的准确性,但很难解释模型是基于哪些特征做出判断的。它是否注意到了猫的耳朵?还是猫的颜色?这些特征在网络层中的具体作用是如何的?这些都很难给出明确的解释。

改善可解释性的方法:

  1. 特征可视化:通过可视化中间层的输出,帮助我们了解模型在某些输入数据上的特征提取过程(如卷积神经网络中的特征图)。

  2. 局部可解释性模型:像 LIME(局部可解释模型)或 SHAP(Shapley Additive Explanations)等工具,能够在局部解释模型的预测过程,虽然不能解释整体模型,但可以帮助解释单个预测的依据。

  3. 模型简化:将复杂的深度学习模型转换成简化的模型(如决策树)进行近似解释。

总结:

深度学习模型可解释性差的主要原因在于其复杂的网络结构、巨大的参数数量、非线性变换以及数据驱动的学习方式。这使得即使模型在预测时表现优异,也难以追踪和理解其具体的决策过程。但是深度学习在实验上的效果是非常好的。

国内大概2016年开始关注深度学习。

深度学习的发展历史可以从以下几个方面进行分析,特别是结合中国的情况来做解释:

1. 符号主义阶段(20世纪50-70年代)

  • 这个阶段的人工智能(AI)以符号主义为主,也就是专家系统。计算机依赖预先定义好的规则和逻辑来做推理和决策,类似于模仿人类专家的思维过程。

  • 代表事件:1950年图灵设计了国际象棋程序,1962年IBM的Arthur Samuel开发了跳棋程序战胜人类高手。

  • 中国的情况:在这一阶段,中国的人工智能技术还处于起步阶段,主要是跟随国际上的进展,尚未形成系统化的研究。

2. 统计主义阶段(20世纪80-2000年代)

  • 这个阶段人工智能的发展主要依赖统计模型解决问题,特别是支持向量机(SVM)等技术的发展显著提升了机器学习的能力。

  • 代表事件:1993年Vapnik提出SVM算法,1997年IBM的深蓝战胜国际象棋冠军卡斯帕罗夫,标志着人工智能的又一次浪潮。

  • 中国的情况:中国在这一阶段主要以引进和应用为主,人工智能技术在一些高校和科研机构中开始研究和应用,但相对于国际仍有差距。

3. 神经网络和深度学习阶段(21世纪初期)

  • 2012年,AlexNet的出现标志着深度学习开始成为主流方法。它通过卷积神经网络(CNN)显著提高了图像识别的能力。此后,深度学习在语音识别、自然语言处理等领域得到了广泛应用。

  • 2016年,Google AlphaGo 战胜李世石,这是人工智能第三次浪潮的重要里程碑,展示了深度学习和强化学习的强大能力。

  • 中国的情况:在这一阶段,中国的科技企业和研究机构也开始迅速发展深度学习技术。像百度、阿里巴巴、腾讯等大公司建立了强大的人工智能研究团队,推出了深度学习平台(如百度的PaddlePaddle)。中国高校和科研机构也在神经网络和深度学习方面取得了很多成果,人工智能技术在图像处理、语音识别、无人驾驶等领域广泛应用。

4. 大规模预训练模型阶段(2017年至今)

  • 2017年,NLP领域的Transformer框架出现,极大地推动了自然语言处理的发展,成为主流架构。随后BERT、GPT等模型进一步提升了模型的语言理解能力。

  • 2022年,chatGPT的出现,开启了大模型的AIGC(AI生成内容)时代。预训练模型在多个领域大显身手,特别是在生成文本、图像、甚至编写代码等方面都表现出色。

  • 中国的情况:中国在这一阶段也涌现了很多大型预训练模型项目。像华为、阿里巴巴、百度等企业推出了类似GPT的中文预训练语言模型,如华为的“鹏程”、百度的“文心一言”等。中国还逐渐在国际人工智能领域占据一席之地,推出的预训练模型逐步应用于语言翻译、对话系统、自动生成新闻等领域。

2020年到2024年,人工智能领域,特别是深度学习技术在全球范围内取得了重大进展,中国在这一期间也展现出强劲的创新能力。以下是对每年发展状况的简要介绍:

2020年:疫情加速AI应用

  1. 全球疫情推动AI应用

    • 新冠疫情的全球爆发促使人工智能技术在医疗、公共安全和远程办公等领域的应用加速。AI被广泛用于疫情的跟踪、预测、疫苗研发和医疗影像识别中。

    • 例如,AI模型被用来分析CT扫描图像,以辅助医生快速诊断新冠肺炎。

  2. 中国的AI发展

    • 中国在疫情期间快速部署了AI技术,特别是在智能城市、疫情监控和诊断系统方面,AI发挥了巨大作用。例如,AI算法被用于智能测温、面部识别(即使戴着口罩)以及密切接触者的追踪。

    • 同时,远程教育、智慧办公和电子商务领域的AI应用蓬勃发展,推动了国内人工智能产业的全面升级。

2021年:预训练模型的进一步突破

  1. 预训练语言模型大热

    • 预训练模型(如GPT-3)在自然语言处理领域的影响继续扩大。OpenAI的GPT-3在生成文本、回答问题、代码生成等多个任务中展现出惊人的能力,推动了自然语言处理(NLP)的发展。

    • 此时,预训练模型已经开始成为大多数NLP任务的标准,AI开始展现出更广泛的生成内容能力(AIGC)。

  2. 中国的预训练模型崛起

    • 中国的科技巨头和研究机构加大了在预训练模型方面的投入,推出了多个大规模中文语言模型。例如,百度推出了“文心大模型”,该模型可以用于对话、内容生成、文本分析等任务,表现出强大的中文处理能力。

    • 同时,中国的企业开始将AI应用于法律、医疗、金融等垂直领域,并在工业制造中加速智能化转型。

2022年:AIGC(AI生成内容)的崛起

  1. chatGPT引领AI生成内容热潮

    • OpenAI发布的chatGPT在全球范围内掀起了AI生成内容(AIGC)的热潮。chatGPT能够生成具有语义和逻辑一致性的长文本,涵盖从编写代码到创作诗歌等多种任务。

    • AIGC技术开始逐渐应用于更多领域,如新闻自动生成、电影剧本撰写、广告文案创作等。

  2. 中国的AI大模型发展

    • 中国科技企业如阿里、百度、华为等纷纷推出大规模预训练模型,如阿里的“M6模型”、百度的“文心一言”等。这些模型的出现标志着中国在自然语言处理和AI生成内容方面已站在全球前沿。

    • 政府和企业进一步推动AI与传统产业的结合,AI技术被广泛应用于智慧医疗、智能金融、智能制造等领域。AI生成内容技术也逐渐在广告、游戏等创意产业中展现出巨大潜力。

2023年:大模型与垂直领域结合加深

  1. 大模型应用逐渐多样化

    • 2023年,大规模预训练模型进一步优化,并开始更多应用于细分垂直领域。医疗、金融、教育等行业逐渐将AI大模型融入自身的工作流中。例如,AI模型在医疗诊断、金融风控、自动化教育辅导中得到了广泛应用。

    • AI伦理和安全成为讨论的焦点,全球范围内对AI的监管讨论加剧,各国都在探索如何制定AI发展的监管框架。

  2. 中国的大模型应用落地

    • 在中国,AI大模型应用越来越广泛地结合各行各业。智慧医疗领域,AI辅助诊断、药物研发等取得了显著进展;金融领域,AI大模型被用于风险评估、智能投顾等业务;教育领域,AI自动化辅导和个性化教育方案逐渐普及。

    • 此外,中国科技企业在图像生成、虚拟主播等方面的AI生成内容技术也逐渐成熟,并广泛应用于电商、短视频平台等行业。

2024年:AIGC和AI治理并行发展

  1. AIGC进入主流市场

    • 到2024年,AI生成内容(AIGC)技术已深度渗透到媒体、娱乐、教育等行业。AI不再仅仅是工具,而是成为创意生产的合作伙伴。用户可以通过简单的指令,生成高质量的文本、图片、视频等内容。

    • 例如,AI能够生成完整的广告创意、新闻报道,甚至电影剧本,大大降低了创作门槛并提高了生产效率。

  2. 中国的AI政策与技术进步

    • 2024年,中国继续在全球AI领域保持强劲势头。随着AI在各个行业的落地,中国政府也加强了AI相关政策的制定与监督,确保AI技术的安全、透明、可控发展。

    • 同时,随着5G、物联网等技术的进一步发展,AI在智能城市、自动驾驶、智慧农业等领域的应用变得更加深入。

    • 此外,中国的AI人才培养体系进一步完善,人工智能学科在高校中蓬勃发展,为未来的科技进步奠定了坚实基础。

总结:

中国的深度学习和人工智能技术从引进、模仿到自主创新,已经走过了漫长的历程。在神经网络和大规模预训练模型阶段,中国科技企业和研究机构逐渐占据了重要地位,推动了深度学习技术在各个领域的应用与发展。

2020年到2024年,全球尤其是中国的人工智能技术经历了从疫情加速应用到大模型、生成内容的快速发展。中国的AI行业在这一阶段取得了长足的进步,不仅在技术上实现了突破,应用上也开始大规模落地,推动了传统产业的智能化转型,同时也逐步加快了与全球AI技术的接轨。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/430268.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VOC2007数据集

目标检测入门code 文件目录 下载数据集——在官网下载VOC2007数据集 下载训练数据集 TRAIN data 下载测试数据集 TEST data 解压数据集 解压——训练数据集,在服务器上,目录为VOCdevkit 部分文件目录 全部文件总目录 解压——测试数据集 (…

移情别恋c++ ദ്ദി˶ー̀֊ー́ ) ——14.AVL树

1.AVL 树 1.1AVL 树的概念 二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查 找元素相当于在顺序表中搜索元素,效率低下。因此,两位俄罗斯的数学家G.M.Adelson-Velskii 和E.M.Landis在1962…

数据结构之图的遍历

文章目录 广度优先遍历深度优先遍历 广度优先遍历 广度优先遍历过程类似于二叉树的层序遍历,从起始顶点开始一层一层向外进行遍历 比如现在要找东西,假设有三个抽屉,东西在那个抽屉不清楚,现在要将其找到,广度优先遍历…

【FFT】信号处理——快速傅里叶变换【通俗易懂】

快速傅里叶变换(Fast Fourier Transform, FFT)是一种用于将信号从时间域转换到频率域的算法。 傅里叶变换的核心思想是:任何周期性信号都可以分解成多个不同频率的正弦波或余弦波的叠加。 简单来说,FFT可以帮助我们理解一个信号…

鲲鹏计算这五年:硬生态基本盘稳住,才能放手进击软生态

文 | 智能相对论 作者 | 叶远风 数智化深入发展、新质生产力成为主旋律的当下,本土计算产业的发展被寄予越来越多的关注和期待。自2019年开启以来,鲲鹏计算产业生态已经整整走过5个年头。 因此,今年华为全联接大会的鲲鹏之夜,在…

大模型价格战,打到了负毛利,卷or不卷?

国产大模型淘汰赛在加速。这轮淘汰赛会持续一两年,只有少数真正具备实力的基础模型企业能继续活下去 中国市场的大模型价格战已经打了近半年。这轮价格战已经打到了负毛利,而且暂时没有停止迹象。头部云厂商仍在酝酿新一轮降价。这轮降价会在今年9月下旬…

【初阶数据结构】详解二叉树 - 树和二叉树(三)(递归的魅力时刻)

文章目录 前言1. 二叉树链式结构的意义2. 手搓一棵二叉树3. 二叉树的遍历(重要)3.1 遍历的规则3.2 先序遍历3.3 中序遍历3.4 后序遍历3.5 遍历的代码实现3.5.1 先序遍历代码实现3.5.2 中序遍历代码实现3.5.3 后序遍历代码实现 4. 统计二叉树结点的个数5.…

【iOS】MVC架构模式

文章目录 前言MVC架构模式基本概念通信方式简单应用 总结 前言 “MVC”,即Model(模型),View(视图),Controller(控制器),MVC模式是架构模式的一种。 关于“架构模式”&a…

828华为云征文|华为云Flexus X实例docker部署最新Appsmith社区版,搭建自己的低代码平台

828华为云征文|华为云Flexus X实例docker部署最新Appsmith社区版,搭建自己的低代码平台 华为云最近正在举办828 B2B企业节,Flexus X实例的促销力度非常大,特别适合那些对算力性能有高要求的小伙伴。如果你有自建MySQL、Redis、Ng…

Apache Hudi现代数据湖核心技术概论

1. 什么是 Apache Hudi 1.1 简介 Apache Hudi (Hadoop Upserts Deletes and Incrementals) 是一个开源的数据湖框架,旨在提供高效的数据管理和数据更新功能。它允许在大数据平台上执行诸如数据插入、更新和删除操作,同时支持增量式数据处理。Hudi 最初…

C++之STL—vector容器基础篇

头文件 #include <vector> //vector容器 #include <algorithm> //算法 基本用法&&概念 vector<int> v; v.push_back(10); vector<int >::iterator v.begin(); v.end(); 三种遍历方式 #include <vector> #include <algorithm>…

C++基础知识7 list

list 1. list的介绍及使用1.1 list的介绍1.2 list的使用1.2.1 list的构造1.2.2 list iterator的使用1.2.3 list capacity1.2.4 list element access1.2.5 list modifiers1.2.6 list的迭代器失效 2.1 模拟实现list 1. list的介绍及使用 1.1 list的介绍 1.2 list的使用 1.2.1 l…

51.字符串比较实例-用户登录

//已知正确的用户名和密码&#xff0c;请用程序实现模拟用户登录 //总共三次机会&#xff0c;登录之后给出相应的提示 import java.util.Scanner;public class 登录 {public static void main(String[] args) {//1.定义两个变量&#xff0c;记录正确的用户名和密码String righ…

操作系统迁移(CentOs -> Ubuntu)

目录 1. CentOs操作系统:备份数据 1.1 gitee备份 1.1.1 CentOs安装git 1.1.1.1 运行安装命令 1.1.1.2 运行安装命令时出错 1.1.1.3 再次执行安装命令 1.1.2 gitee创建仓库 1.1.2.1 创建仓库 1.1.3 备份 1.1.3.1 复制链接 1.1.3.2 克隆仓库 1.1.3.3 备份 1.3.3.4 查…

uniapp小程序持续获取用户位置信息,后台位置获取

做一个小程序持续获取用户位置信息的功能&#xff0c;即使小程序切换到后台也能继续获取&#xff0c;getLocation这个api只有小程序在前台才能获取位置&#xff0c;所以不用这个 先申请一个腾讯地图key 在uniapp项目配置源码视图里加上这个代码 先获取权限&#xff0c;再开启…

ERNIESpeed-128K在线智能聊天机器人项目(附源码)

本项目是基于百度千帆的智能聊天模型ERNIESpeed-128K开发的 一、技术栈 后端&#xff1a;java8springboot2.6.13 数据库&#xff1a;MongoDB 前端&#xff1a;vue2element-uimarked&#xff08;md格式&#xff09; 二、MongoDB与对话存储的设计 使用MongoDB来储存对话&am…

【Linux】常用指令(下)(内含more、less、 head、tail、date、find、grep、zip、tar以及学习笔记)

文章目录 前言1. more指令2. less指令&#xff08;重要&#xff09;3. head指令4. tail指令5. 管道&#xff08;做到学会使用即可&#xff09;6. date指令6.1 时间戳 7. cal指令8. find指令9. grep指令10. zip/unzip指令11. tar指令 前言 Linux下的常用指令终于要在本文落下帷…

kitti2bag原始数据转为bag包工具使用、SLAM精度评估工具evo安装及使用、KITTI原始数据集对应关系

最近在学习SLAM&#xff0c;需要使用到精度评估工具evo&#xff0c;写下这篇笔记记录自己暂时使用到的命令&#xff0c;在此只做一个记录&#xff0c;后续学习过程中需要使用新命令会逐渐追加上去。 目录 evo的安装 evo的使用 Kitti序列00-10对应关系 kitti2bag工具包安装…

docker部署Stirling-PDF

github网址&#xff1a; GitHub - Stirling-Tools/Stirling-PDF: #1 Locally hosted web application that allows you to perform various operations on PDF files 1、官方docker镜像无法拉取&#xff0c;使用别人阿里云私人镜像仓库下载Stirling-PDF镜像&#xff1a; dock…

Maven-四、继承

Maven进阶 文章目录 Maven进阶前言继承设置继承依赖管理总结 前言 一个项目中的不同模块可能引用的是同一个依赖&#xff0c;在这种情况下&#xff0c;单独在某个模块内引用太麻烦&#xff0c;于是maven使用继承的思想&#xff0c;在父模块中配置依赖包&#xff0c;其他需要这…