AI分支知识之机器学习,深度学习,强化学习的关系

机器学习,深度学习,强化学习的关系

这一篇文章我们来探讨下AI领域中机器学习(ML)、深度学习(DL)和强化学习(RL)的关系。

一、机器学习(ML):从数据中找到模式

核心思想:给定大量数据,计算机从数据中总结规律,形成一个数学模型,然后用这个模型去处理新的数据。


例子:判断一封邮件是垃圾邮件还是正常邮件

  • 传统编程方式:人类自己写规则,比如:
    • 如果 邮件标题包含 “中奖”、“免费”、“转账” → 这是垃圾邮件
    • 否则 这是正常邮件
  • 机器学习方式
    1. 先收集大量邮件,并标记哪些是垃圾邮件,哪些是正常邮件(训练数据)。
    2. 让算法自己学习这些邮件的特征,比如垃圾邮件通常包含某些词、发件地址异常等。
    3. 训练出一个分类模型,以后只要输入一封新邮件,它就能预测是垃圾邮件还是正常邮件。

关键技术

  • 监督学习(Supervised Learning):有标注的数据(如垃圾邮件 vs. 正常邮件)。
  • 无监督学习(Unsupervised Learning):没有标注的数据,系统自己寻找模式(如聚类分析)。
  • 半监督学习(Semi-Supervised Learning):部分数据有标签,部分没有,结合两者来训练。
  • 经典算法:决策树、SVM(支持向量机)、KNN(K-近邻)、随机森林、逻辑回归、梯度提升树(GBDT)等。

应用场景

  • 分类问题:垃圾邮件检测、信用卡欺诈检测、癌症检测(恶性/良性)。
  • 回归问题:房价预测、天气预测、股票价格预测。

二、深度学习(DL):用神经网络从数据中自动提取特征

机器学习 VS. 深度学习

机器学习虽然很强大,但有个问题:需要手工设计特征

  • 比如判断一张图片是猫还是狗,传统机器学习需要人工提取“耳朵形状”、“毛发颜色”、“鼻子大小”等特征,然后训练模型。
  • 深度学习(Deep Learning) 解决了这个问题,它可以自己从数据中提取特征,无需人为干预。

深度学习的核心:神经网络(Neural Networks)

深度学习使用 人工神经网络(Artificial Neural Networks, ANN),可以类比人脑的神经元如何处理信息。

神经网络的层次结构

  • 输入层:接收数据(如图片的像素点、文本的单词等)。
  • 隐藏层(多层):自动提取数据的深层特征,比如边缘、轮廓、复杂形状等。
  • 输出层:输出结果,如识别物体的类别。

常见的深度学习网络

  • CNN(卷积神经网络):主要用于图像处理(如人脸识别、目标检测)。
  • RNN(循环神经网络):适用于处理时间序列数据(如语音识别、机器翻译)。
  • Transformer:用于自然语言处理(如 ChatGPT、BERT)。

案例:人脸识别

  1. 机器学习的方法:提取特征(眼睛、鼻子、嘴巴的位置等),然后用 SVM 进行分类。
  2. 深度学习的方法:CNN 直接输入图片,让神经网络自己学会特征提取,最终实现高准确率的人脸识别。

深度学习的优点

  • 自动特征提取,不需要人工定义特征。
  • 处理复杂数据,如图像、语音、自然语言。
  • 适合大数据,数据越多,效果越好(但需要高计算资源)。

应用场景

  • 计算机视觉:人脸识别、自动驾驶、医疗影像分析。
  • 自然语言处理:机器翻译(Google Translate)、文本摘要、智能客服。
  • 语音识别:Siri、Alexa、语音转文字。

三、强化学习(RL):让智能体(Agent)在环境中学习最优策略

强化学习 VS. 监督学习

  • 监督学习:你告诉模型答案,比如“这是一只猫”或者“这是一封垃圾邮件”。
  • 强化学习:没有现成的答案,智能体(Agent)要在 试错(Trial and Error) 中找到最优策略。

核心概念

  • 智能体(Agent):学习者(如 AlphaGo、自动驾驶系统)。
  • 环境(Environment):智能体所处的世界(如围棋棋盘、驾驶道路)。
  • 状态(State, s):当前的情况(如游戏画面、车辆位置)。
  • 动作(Action, a):智能体可以采取的行为(如走棋、踩油门)。
  • 奖励(Reward, r):正向奖励(赢棋 +1),负向奖励(输棋 -1)。
  • 策略(Policy, π):智能体如何根据状态选择动作的规则。

案例:教 AI 玩超级玛丽

  1. 机器人开始玩,完全不知道怎么跳。
  2. 每次碰到怪物,扣分(负奖励);每次跳过障碍物,加分(正奖励)。
  3. 经过成千上万次的试错,AI 逐渐学会了最优策略。

强化学习的典型算法

  • Q-learning:表格形式的强化学习方法(适用于小规模环境)。
  • DQN(深度 Q 网络):结合深度学习的强化学习方法(用于大规模环境,如玩 Atari 游戏)。
  • PPO(近端策略优化)A3C(异步优势演员评论家):适用于更复杂的强化学习任务(如机器人控制)。

应用场景

  • 游戏 AI:AlphaGo、DeepMind 训练 AI 玩 Atari 游戏。
  • 机器人控制:波士顿动力的机器人学会行走、跳跃、翻滚。
  • 自动驾驶:通过试错优化驾驶策略(如 Waymo、Tesla)。

四、机器学习、深度学习和强化学习的关系

可以用**“树状结构”**来理解:

人工智能(AI)
│
├── 机器学习(ML):从数据中学习规律
│   ├── 监督学习(分类/回归)
│   ├── 无监督学习(聚类/降维)
│   ├── 强化学习(RL):基于奖励和试错的学习
│
├── 深度学习(DL):用神经网络自动提取特征
│   ├── CNN(图像)
│   ├── RNN(时间序列)
│   ├── Transformer(自然语言)
│
└── 深度强化学习(DRL):结合深度学习和强化学习├── AlphaGo(围棋 AI)├── 自动驾驶├── 游戏 AI(Dota 2、Atari)

总结

  • 机器学习 = 数据 + 算法,找到规律
  • 深度学习 = 神经网络自动学习特征
  • 强化学习 = 试错 + 奖励,优化决策
  • 深度强化学习 = 深度学习 + 强化学习,让 AI 更智能

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15689.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

5 个释放 安卓潜力的 Shizuku 应用

Shizuku 软件推荐:释放安卓潜力的五款应用 Shizuku (日语:雫,意为“水滴”) 正如其名,是一款轻巧但功能强大的安卓工具。它无需 Root 权限,通过 ADB (Android Debug Bridge) 授权,即可让应用调用系统 API&…

前端权限控制和管理

前端权限控制和管理 1.前言2.权限相关概念2.1权限的分类(1)后端权限(2)前端权限 2.2前端权限的意义 3.前端权限控制思路3.1菜单的权限控制3.2界面的权限控制3.3按钮的权限控制3.4接口的权限控制 4.实现步骤4.1菜单栏控制4.2界面的控制(1)路由导航守卫(2)动态路由 4.3按钮的控制…

分布式kettle调度平台- web版转换,作业编排新功能介绍

介绍 Kettle(也称为Pentaho Data Integration)是一款开源的ETL(Extract, Transform, Load)工具,由Pentaho(现为Hitachi Vantara)开发和维护。它提供了一套强大的数据集成和转换功能&#xff0c…

Docker容器访问外网:启动时的网络参数配置指南

在启动Docker镜像时,可以通过设置网络参数来确保容器能够访问外网。以下是几种常见的方法: 1. 使用默认的bridge网络 Docker的默认网络模式是bridge,它会创建一个虚拟网桥,将容器连接到宿主机的网络上。在大多数情况下,使用默认的bridge网络配置即可使容器访问外网。 启动…

大语言模型RAG,transformer

1、RAG技术流总结 第一张图是比较经典的RAG知识图谱,第二张图是更加详细扎实的介绍图。 1.1 索引 坦白来说这部分的技术并不是大模型领域的,更像是之前技术在大模型领域的应用;早在2019年我就做过faiss部分的尝试,彼时索引技术已…

数据结构与算法(test3)

七、查找 1. 看图填空 查找表是由同一类型的数据元素(或记录)构成的集合。例如上图就是一个查找表。 期中(1)是______________. (2)是______________(3)是_____关键字_______。 2. 查找(Searching) 就是根据给定的某个值, 在查…

机器学习在癌症分子亚型分类中的应用

学习笔记:机器学习在癌症分子亚型分类中的应用——Cancer Cell 研究解析 1. 文章基本信息 标题:Classification of non-TCGA cancer samples to TCGA molecular subtypes using machine learning发表期刊:Cancer Cell发表时间:20…

48V电气架构全面科普和解析:下一代智能电动汽车核心驱动

48V电气架构:下一代智能电动汽车核心驱动 随着全球汽车产业迈入电动化、智能化的新时代,传统12V电气系统逐渐暴露出其无法满足现代高功率需求的不足。在此背景下,48V电气架构应运而生,成为现代电动汽车(EV&#xff09…

Mac(m1)本地部署deepseek-R1模型

1. 下载安装ollama 直接下载软件,下载完成之后,安装即可,安装完成之后,命令行中可出现ollama命令 2. 在ollama官网查看需要下载的模型下载命令 1. 在官网查看deepseek对应的模型 2. 选择使用电脑配置的模型 3. copy 对应模型的安…

操作教程丨使用1Panel开源面板快速部署DeepSeek-R1

近期,DeepSeek-R1模型因其在数学推理、代码生成与自然语言推理等方面的优异表现而受到广泛关注。作为能够有效提升生产力的工具,许多个人和企业用户都希望能在本地部署DeepSeek-R1模型。 通过1Panel的应用商店能够简单、快速地在本地部署DeepSeek-R1模型…

免费在腾讯云Cloud Studio部署DeepSeek-R1大模型

2024年2月2日,腾讯云宣布DeepSeek-R1大模型正式支持一键部署至腾讯云HAI(高性能应用服务)。开发者仅需3分钟即可完成部署并调用模型,大幅简化了传统部署流程中买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等繁琐步骤。…

C语言-结构体

1.共用体: union //联合--共用体 早期的时候,计算机的硬件资源有限, 能不能让多个成员变量 公用同一块空间 //使用方式 类似 结构体 --- 也是构造类型 struct 结构体名 { 成员变量名 }; union 共用体名 { 成员变量名 }; //表示构造了一个共用体…

多头自注意力中的多头作用及相关思考

文章目录 1. num_heads2. pytorch源码演算 1. num_heads 将矩阵的最后一维度进行按照num_heads的方式进行切割矩阵,具体表示如下: 2. pytorch源码演算 pytorch 代码 import torch import torch.nn as nn import torch.nn.functional as Ftorch.set…

数据仓库和商务智能:洞察数据,驱动决策

在数据管理的众多领域中,数据仓库和商务智能(BI)是将数据转化为洞察力、支持决策制定的关键环节。它们通过整合、存储和分析数据,帮助组织更好地理解业务运营,预测市场趋势,从而制定出更明智的战略。今天&a…

C++ ——从C到C++

1、C的学习方法 (1)C知识点概念内容比较多,需要反复复习 (2)偏理论,有的内容不理解,可以先背下来,后续可能会理解更深 (3)学好编程要多练习,简…

半导体制造工艺讲解

目录 一、半导体制造工艺的概述 二、单晶硅片的制造 1.单晶硅的制造 2.晶棒的切割、研磨 3.晶棒的切片、倒角和打磨 4.晶圆的检测和清洗 三、晶圆制造 1.氧化与涂胶 2.光刻与显影 3.刻蚀与脱胶 4.掺杂与退火 5.薄膜沉积、金属化和晶圆减薄 6.MOSFET在晶圆表面的形…

Avnet RFSoC基于maltab得5G 毫米波 开发工具箱

使用 MATLAB 连接到 AMD Zynq™ RFSoC 评估板。使用 RF 附加卡执行 OTA 测试。使用 HDL Coder 部署算法 版本要求: 大于 2023b 需要以下支持包之一: 适用于 Xilinx 基于 Zynq 的无线电(R2023b 及更早版本)的通信工具箱支持包适…

第三节 docker基础之---Commit+Dockerfile制作

docker目前镜像的制作两种方法: 1,基于docker Commit制作镜像 2,基于dockerfile制作镜像,Dockerfile 为主流的制作方式 如果不制作镜像删除容器之后则里面配置的文件也随之删除: [rootdocker ~]# docker images 查看…

推荐一个免费的、开源的大数据工程学习教程

在当今信息爆炸的时代,每一个企业都会产生大量的数据,而大数据也已经成为很多企业发展的重要驱动力,然而如何有效得处理和分析这些海量的数据,却是一个非常有挑战的技术。 今天推荐一个免费的数据工程教程,带你系统化…

【文档智能多模态】英伟达ECLAIR-端到端的文档布局提取,并集成阅读顺序方法

笔者在前期一个系列分享了各种文档智能相关的技术方法,可以参考《文档智能系列栏目》,涵盖各种常见方法。 下面直接看看这个端到端的文档智能结构化方法,供参考。 方法 一、架构 ECLAIR 采用了一个较大的视觉编码器(657M 参数…