人工智能 机器学习 深度学习:概念,关系,及区别说明

如果过去几年,您读过科技主题的文章,您可能会遇到一些新词汇,如人工智能(Artificial Intelligence)、机器学习(Machine Learning)和深度学习(Deep Learning)等。这三个词的使用频率很高,几乎无处不在,但是他们具体都是什么?有什么不同之处?他们之间的关系是什么?

本文将详细解释人工智能,机器学习和深度学习的概念,并说明他们之间的关系。此外,本文还将介绍一些构建这些技术的最佳实践,以及在公司中实施这些技术的注意事项。

人工智能、机器学习和深度学习

谈论AI、ML和深度学习之间区别的最佳切入点是,将这三者视为一个梯度,每一个都是前一项的一部分。人工智能(AI)属于概括性术语,包含机器学习在内,而深度学习又是机器学习的一种类型。

现在,您已经基本了解三者的关系。接下来,让我们进行深入探讨。

人工智能(Artificial Intelligence)

人工智能(Artificial Intelligence)是一个概括性术语,包含多种技术。简单地说,AI是指一种能够模仿或体现人类智能特征的机器。几十年来,AI一直是一个热门理论,也是电影和科幻小说中的部分情节。

而今,AI已经被使用在我们身边。各行各业都在使用AI来自动化、预测、优化一些原本由人类完成的任务。这不仅能为企业节省金钱和时间,还可以将员工从重复枯燥的任务中解放出来,提高员工幸福感。

AI分为三大类型:

  • 狭义人工智能(又称弱人工智能,Artificial Narrow Intelligence,简称ANI)
  • 通用人工智能(又称强人工智能,Artificial General Intelligence,简称AGI)
  • 超级人工智能(又称超人工智能,Artificial Super Intelligence,简称ASI)

第一种形式的人工智能,即狭义人工智能,通常被称为“弱”AI,而另两种则被称为“强”AI。弱AI或侠义人工智能仅可完成某项特定的任务。但是,通用人工智能和超级人工智能,即强AI,可完成多项任务。

狭义人工智能(又称弱人工智能,Artificial Narrow Intelligence ,ANI)

狭义人工智能(ANI)是一种弱AI,只能完成一项任务。虽然弱AI擅长完成某类任务,但在其他领域或任务中,弱AI就比不上人类了。

弱AI的一个示例是深蓝(Deep Blue),这是一台于1996年击败国际象棋冠军加里·卡斯帕罗夫的计算机。除了每秒可以评估2亿个国际象棋位置之外,深蓝(Deep Blue)无法胜任其他任务,是一种弱AI。

ANI广泛应用于科学、商业和医疗保健领域,以创建擅长某项特定任务的AI解决方案。弱AI程序常见的应用有:阅读医学图像,检测制造异常,以及发现商业数据中的规律。

通用人工智能(又称强人工智能,Artificial General Intelligence ,AGI)

通用人工智能(AGI)是两种强人工智能之一。AGI能够完成多项任务,这超越了机器在能力上变得更像人类的界限。在没有人类输入的情况下,AGI可以自主做出决定。AGI既有逻辑,也有情感。

目前还没有纯粹的AGI模型,但我们已经在朝着这个目标努力前进。聊天机器人和数字虚拟助理的沟通技巧越来越熟练,并且能对直接刺激做出情绪反应。一些研究人员也已开始训练机器人阅读人类情绪的能力。虽然这令人兴奋,但有情感的AI并非只是能读懂情绪并做出反应那么简单,我们还需要很多努力才能创建出通用人工智能。

超级人工智能(又称超人工智能,Artificial Super Intelligence ,ASI)

科幻小说中讨论的AI是一种超级人工智能(ASI),是强AI的第二种类型。ASI模型是比人类更聪明、更有智慧和更具创造力的机器。这类AI尚未现世,只存在于科幻书中。甚至,科学家从未梦想过可以创造出这类强AI。

虽然目前尚未创造出这类强AI,但科学家已在一些不同的领域取得了进展,最终将有利于实现强AI。这些领域包括:

  • 机器人学:建立自给自足机器人,比如Roomba扫地机器人。
  • 机器推理:训练AI模型基于数据库或库的演绎和归纳能力,以做出决定并得出结论。
  • 机器学习:指机器用来完成某项特定任务的算法和计算机模型。

虽然现在大多数AI还只是弱AI,或者说是狭义AI,只能完成某一项任务,但对世界各地的企业和个人来说,这些AI仍具有革命性的意义。AI技术会继续向前发展,在自身迭代过程中不断超越已有的智能水平。

机器学习(Machine Learning)

AI的智能源自哪里?答案是机器学习(Machine Learning, ML)。机器学习是更大的AI领域中的一个子领域。ML的重点是教会计算机如何学习,而不是通过编程来完成特定任务。或者可以说,机器学习是教授和训练AI完成特定任务的算法和模型。

机器学习有如下三个关键特征:

  • 数据集:数据集即数据点或样本的集合。每一个数据可以是一个数字、图像、单词、音频文件或视频。数据集常用于训练机器学习模型。
  • 特征:特征是指任务解决方案的单体数据,并教授机器学习模型所寻求的内容。
  • 算法:指机器学习模型用来分析数据并得出结论的过程或一组规则。

究其根本,机器学习模型使用一种算法来读取数千个或数百万个数据,然后得出结论或预测。为了正确读取数据,机器学习模型需要算法来指导其工作流程。机器学习模型必须要经过训练,才能分析数据和得出结论。我们可以利用数据集和特征来训练机器学习模型,使模型可以根据现实世界的数据,利用算法来得出结论。

计算机视觉(Computer Vision, CV)是机器学习的最佳应用之一。很多不同的用例都有应用计算机视觉(CV),但最令人激动的用例是自动驾驶汽车。

机器学习分为四类:监督学习、非监督学习、半监督学习和强化学习。

监督学习(Supervised Learning)

监督学习模型是指在一位老师的指导下,使用具有标注训练数据的数据集训练模型。训练数据在机器学习模型中运行后,再通过新的数据来测试模型。由研究人员负责审核模型结果的准确性。在准确率达到所设定阈值前,需要持续训练和再训练机器学习模型。

那些用于垃圾邮件过滤、语言检测、分类和计算机视觉的机器学习模型,经常会采用监督学习方法。

非监督学习(Unsupervised Learning)

采用非监督学习方法来训练的机器学习模型,没有任何给定特征或目标。通过给定数据,训练机器学习模型搜索模式。非监督机器学习模型适合用来将数据聚类或分类,以及分析数据和提供见解。

非监督机器学习模型通常用于数据分割、异常检测、推荐引擎和风险管理。

半监督学习(Semi-Supervised Learning)

半监督学习是将监督和非监督机器学习模型相结合。机器学习模型接收部分标注和部分未标注的数据集。虽然程序员可以预测机器学习模型会在数据中找到什么模式,但模型必须在没有任何训练的情况下找到数据中的结构。

强化学习(Reinforcement Learning)

采用强化学习方法来学习的机器学习模型,其学习方式与人类最为相似。强化学习是一种试错法。机器学习模型从正强化或负强化中学习。

强化学习是机器学习模型中最令人兴奋的形式之一。在强化学习模式下,程序员可以不用跟踪模型,让模型进入自主学习状态,并在不完善的环境中进行动态学习。

强化学习应用于游戏、机器人、自动驾驶汽车和资源管理,以及2023年最令人瞩目的大语言模型。在LLM的训练中,以人类反馈为基础的强化学习是非常重要的微调方式,为大模型的反馈质量提供重要保证。

深度学习(Deep Learning)

深度学习(Deep Learning, DL)是机器学习的一个子领域。深度学习和其他类型机器学习的区别是算法的学习方式和算法使用的数据量。虽然深度学习需要大量数据集,但只需要极少的人工干预。

深度学习旨在模仿拥有复杂多层神经网络的人脑结构。数据通过连接通道在神经网络之间传输。深度机器学习模型可以使用标注数据集来学习,但这些数据集并不是必需品。深度学习模型可以通过监督或非监督学习模式来学习。

人工智能深度学习最令人兴奋的一个方面是,它可以使用非结构化或未标注的数据进行学习。未来的AI时代,模型能够在非监督模式下学习。

人工智能、机器学习和深度学习的关键区别

经过前面的介绍,我们了解到AI、机器学习和深度学习是同一主题下的分支,他们的关系如下:

  • 人工智能AI是算法的总称,这些算法用于检验数据,找出模式和解决方案。人工智能是一种类似于人类解决问题的能力。大多数AI项目均使用机器学习或深度学习。
  • 机器学习使用数据和算法来解决某个或多个问题,是人工智能的一种类型。
  • 深度学习使用神经网络来学习,以及通过非结构化数据来预测,是一种高级的机器学习类型。

人工智能、机器学习和深度学习的不同切入角度

当涉及AI、机器学习和深度学习时,您可以采取不同的方法设计项目。设计和部署AI项目有两种最常见的方法,即以模型为中心和以数据为中心。

以模型为中心

以模型为中心的AI项目会将大量时间花费在开发正确的AI或机器学习模型上。当您将大量时间花费在模型构建上时,您就不会在第一时间就关注数据。虽然您也会收集所需的数据,但您的重点是构建一个能够处理数据噪音的绝佳模型。在整个项目过程中,您要不断改进、调整模型和代码,以提高模型性能。

以数据为中心

与以模型为中心的方法相比,不同的是,您会拥有一个以数据为中心的模型。这类型模型主要关注数据,而不是模型本身。澳鹏坚信,数据是AI项目中最重要的部分。

无论您设计哪种类型的AI、ML或深度学习项目,您都需要高质量数据来启动项目。数据就是AI的“食粮”。数据收集、清理和标注是AI项目开发过程中的重要组成部分。即使AI项目已经启动,您也需要持续标注和改善数据质量,以获得更佳结果。

机器学习和AI专家Andrew Ng建议,数据准备应占用您80%的时间和资源,而实际的模型训练应仅占用20%。训练一直是大多数正在启动AI项目的企业的主要关注点,但如今这种观点已开始发生变化。相关研究和数据表明,高质量数据会带来高质量的AI结果。

如何利用数据提升机器学习模型

虽然花费大量时间收集、清理和标注数据与训练机器学习模型似乎是对立的,但关注数据确实可以改善项目的投资回报率和结果。下文我们将说明以数据为中心的方法会如何改进机器学习模型。

一致标注

当涉及到数据时,一致性是关键。您必须一致地标注数据,即使是不同批次的数据和不同数据标注者所标注的数据。至关重要的是,在数据标注过程中,您对质量保证要有高的期望和强有力的政策,以确保正确标注数据。

使用噪音标注

在建立以数据为中心的机器学习模型时,另一个反直觉的建议是故意在标注过程中引入一些噪音,或不一致的情况。

一致性是小型数据集的关键。这有助于训练模型并获得高质量的结果。但是,当您开始处理大型数据集时,一点噪音实际上是有益的。当数据过于完美时,机器学习模型会无法在现实世界中发挥作用,因为现实世界中没有十全十美的事情。实际上,在数据中添加一些噪音可以提高机器学习模型的准确性和能力。我们可以为您准备合适程度的噪音数据,提高机器学习模型的性能。

针对质量保证创建系统化的解决方案

成功部署以数据为中心的机器学习模型的关键步骤之一是质量保证。在模型和数据的整个生命周期中,您需要定期进行检查。

在数据标注过程中,要确保所有数据标注者以相同的方式标注数据点,这对质量保证来说至关重要。如果在质量保证过程中发现有差异,您可以重新培训标注人员,以纠正错误标注的数据点。不断地检查模型及其偏移情况也很重要。

现在,机器学习辅助的质检工具也已经开始流行,在预标注、人工校对、人工质检之外,机器学习辅助的质检工具可以更高效地帮助进行质量检查,保证数据质量符合要求,并提高标注效率。

机器学习模型并不只是训练和完成。您必须定期检查、更新和重新训练模型,确保模型持续产生准确的结果。将系统范围的质量保证政策落实到位,有助于确保机器学习模型保持准确性。

总结

人工智能、机器学习和深度学习经常被提到,他们是一个整体中的不同分支。深度学习是机器学习的一种类型,而机器学习又是AI的一个子领域。

而且,就像其他新技术一样,社会上对于如何最好地实施和使用这项技术有着不同的意见。有些人认为,AI和机器学习模型中最重要的部分是模型本身。其他人,包括我们自己,知道数据是促进模型发挥作用并实现最高投资回报的关键部分。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/225804.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Unity学习笔记】1.创建场景

创建场景 注1:samplescene(示例场景)、standard assets(标准资产)、favorites(收藏夹)、terrain(地形)。 注2:favorites用于存放各种资源;sample…

【C语言】数组

㊙️小明博客主页:➡️ 敲键盘的小明 ㊙️ ✅关注小明了解更多知识☝️ 文章目录 前言一、什么是数组?二、一维数组的创建和初始化2.1 一维数组的创建2.2 一维数组的初始化2.3 一维数组的使用3.3 一维数组的存储 三、二维数组的创建和初始化3.1 二维数组…

每日一题(LeetCode)----二叉树-- 二叉树的右视图

每日一题(LeetCode)----二叉树-- 二叉树的右视图 1.题目(199. 二叉树的右视图) 给定一个二叉树的 根节点 root,想象自己站在它的右侧,按照从顶部到底部的顺序,返回从右侧所能看到的节点值。 示例 1: 输入: [1,2,3,nu…

Pandas有了平替Polars

Polars是一个Python数据处理库,旨在提供高性能、易用且功能丰富的数据操作和分析工具。它的设计灵感来自于Pandas,但在性能上更加出色。 Polars具有以下主要特点: 强大的数据操作功能:Polars提供了类似于Pandas的数据操作接口&am…

CentOS 5/6/7 基于开源项目制作openssh 9.6p1 rpm包—— 筑梦之路

背景介绍 开源项目地址:https://github.com/boypt/openssh-rpms.git 该项目主要支持了centos 5 、6、7版本,针对使用了比较老的操作系统进行openssh安全加固,还是不错的项目,使用简单、一件制作,欢迎大家去支持作者。…

Linux操作系统极速入门[常用指令](安装jdk,MySQL,nginx),以及在linux对项目进行部署。

linux概述: Linux是一套免费使用和自由传播的操作系统 我们为什么要学,Linux? 主流操作系统: linux系统版本: 内核版: 由linux核心团队开发,维护 免费,开源 负责控制硬件 发行版&…

电路设计(8)——计时器的multism仿真

1.功能设计 这是一个计时电路,在秒脉冲的驱动下,计时器开始累加,6个数码管分别显示计时的 时:分:秒。 仿真图如下所示: 左边的运放构成了振荡电路,可以产生脉冲波。这个脉冲波给计时电路提供基准…

postman进阶使用

前言 对于postman的基础其实很容易上手实现,也有很多教程。 对于小编我来说,也基本可以实现开发任务。 但是今年我们的高级测试,搞了一下postman,省去很多工作,让我感觉很有必要学一下 这篇文章是在 高级测试工程师ht…

数据探查系列:如何进行有意义的探索性数据分析(EDA)

如何进行有意义的探索性数据分析(EDA) 目录 1. 设置 1.1 导入库1.2 导入数据1.3 数据集特征1.4 数据集属性 2. 探索训练集和测试集 2.1 训练集 - 快速概览2.2 训练集 - 基本统计2.3 测试集 - 快速概览2.4 测试集 - 基本统计 3. 特征分布4. 数据不平衡检查…

websocket 介绍

目录 1,前端如何实现即时通讯短轮询长轮询 2,websocket2.1,握手2.2,握手过程举例2.3,socket.io 3,websocket 对比 http 的优势 1,前端如何实现即时通讯 在 websocket 协议出现之前,…

无需手动搜索!轻松创建IntelliJ IDEA快捷方式的Linux教程

轻松创建IntelliJ IDEA快捷方式的Linux教程 一、IntelliJ IDEA简介二、在Linux系统中创建快捷方式的好处三、命令行创建IntelliJ IDEA快捷方式四、图形界面创建IntelliJ IDEA快捷方式五、常见问题总结 一、IntelliJ IDEA简介 IntelliJ IDEA是一个由JetBrains搞的IDE&#xff0…

vue3+luckyexcel+php在线编辑excel文件

开发过程中,需要开发一个在线编辑excel文档的功能,找到了这个合适的组件 Luckysheet ,一款纯前端类似excel的在线表格,功能强大、配置简单、完全开源。 可以导入文档,预览、编辑、保存、导出等功能,可以满…

侦探IP“去推理化”:《名侦探柯南》剧场版走过26年

2023年贺岁档,柯南剧场版的第26部《黑铁的鱼影》如期上映。 这部在日本狂卷票房128亿日元的作品,被誉为有史以来柯南剧场版在商业成绩上最好的一部。 但该作在4月份日本还未上映前,就于国内陷入了巨大的争议。 试映内容里,灰原…

Android原生实现分段选择

六年前写的一个控件,一直没有时间总结,趁年底不怎么忙,整理一下之前写过的组件。供大家一起参考学习。废话不多说,先上图。 一、效果图 实现思路使用的是radioGroup加radiobutton组合方式。原理就是通过修改RadioButton 的backgr…

云计算:OpenStack 配置二层物理网卡为三层桥的接口

目录 一、理论 1.OpenStack 二、实验 1. Linux系统修改网卡 2.OpenStack 配置二层物理网卡为三层桥的接口 一、理论 1.OpenStack (1)概念 OpenStack是一个开源的云计算管理平台项目,是一系列软件开源项目的组合。由NASA(美国国家航空…

为什么要运营海外社媒?海外云手机能发挥什么作用?

基于海外社媒在全球范围内拥有的大量流量,海外社媒运营成为了品牌推广、内容创作和用户互动的重要途径。本文将探讨海外社媒运营的重要性,并介绍海外云手机在这一过程中的卓越帮助。 海外社媒运营的重要性 首先,海外社媒运营有助于企业扩大品…

学习笔记:数据挖掘与机器学习

文章目录 一、数据挖掘、机器学习、深度学习的区别(一)数据挖掘(二)机器学习(三)深度学习(四)总结 二、数据挖掘体系三、数据挖掘的流程四、典型的数据挖掘系统 一、数据挖掘、机器学…

卷积神经网络 反向传播

误差的计算 softmax 经过softmax处理后所有输出节点概率和为1 损失(激活函数) 多分类问题:输出只可能归于某一个类别,不可能同时归于多个类别。 误差的反向传播 求w的误差梯度 权值的更新 首先是更新输出层和隐藏层之间的权重…

SMART PLC编码器长度测量功能块

SMART PLC编码器转速测量功能块详细算法和源代码,请参考下面文章链接: https://rxxw-control.blog.csdn.net/article/details/134375193https://rxxw-control.blog.csdn.net/article/details/134375193SMART PLC编码器线速度测量功能块算法和源代码请参…

【数据结构和算法】寻找数组的中心下标

其他系列文章导航 Java基础合集数据结构与算法合集 设计模式合集 多线程合集 分布式合集 ES合集 文章目录 其他系列文章导航 文章目录 前言 一、题目描述 二、题解 2.1 前缀和的解题模板 2.1.1 最长递增子序列长度 2.1.2 寻找数组中第 k 大的元素 2.1.3 最长公共子序列…