机器学习1_机器学习定义——MOOC

一、机器学习定义

定义一

1959年Arthur Samuel提出机器学习的定义:

Machine Learning is Fields of study that gives computers the ability to learn without being explicitly programmed.


译文:机器学习是这样的领域,它赋予计算机学习的能力,(这种学习能力)不是通过显著式的编程获得的。

什么是显著式?

人为的告诉计算机,菊花是黄色的,玫瑰是红色的。

非显著式的编程

如果我们只给计算机一堆菊花和玫瑰的图片,编写程序让计算机自己去总结菊花和玫瑰的区别。

计算机通过大量的图片,从一大堆可能的规律中挑出最能区分菊花和玫瑰的一些规律,从而完成对菊花和玫瑰的识别。

举例

需求:让机器人到教室外面的咖啡机去我们冲一杯咖啡。

显著式的编程

我们必须帮计算机规划所处环境,每一步怎么走都要规划的一清二楚。

非显著式的编程

我们可以规定机器人可以采取一系列的行为,例如向左转,向右转等。

规定在特定的环境下,机器人做这些行为所带来的收益,把这个成为收益函数(Reward Function)。

例如,机器人采取的某个行为撞到了墙上,规定这时候的收益函数值为负。如果机器人采取某个行为取到了咖啡,那么程序就要奖励一下这个行为,规定这时候的收益函数值为正

只要程序编的足够好,计算机是可能找到一个最大化收益函数的行为模式。

结论:非显著式的编程能够让计算机通过数据和经验自动的学习完成我们交给的任务。

定义二

1998年Tom Mitshell在《Machine Learning》中的定义:

A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.


译文:一个计算机程序被称为可以学习,是指它能针对某个任务T和某个性能指标P,从经验E中学习。这种学习的特点是,它在T上的被P所衡量的性能,会随着经验E的增加而提高。

举例

以菊花和玫瑰为例。

任务T:编写程序识别菊花和玫瑰

经验E:一大堆菊花和玫瑰的图片

性能指标P:不同的机器学习算法会有不同

识别率(Recognition Rate):让更多的菊花被识别为菊花,更多的玫瑰被识别为玫瑰

根据Tom Mitshell的定义,机器学习就是针对识别菊花和玫瑰这样的任务构造某种算法。这种算法的特点是,当训练的菊花和玫瑰的图片越来越多的时候,也就是经验E越来越多的时候,识别率越来越高。


二、机器学习的分类

机器学习算法可以分为监督学习和强化学习,但这个划分并不绝对。

监督学习(Supervised Learning)

一些输入计算机训练数据(所有的经验E都是由人工采集并输入进计算机的)同时加上标签的机器学习。

对于监督学习,可以根据数据标签的存在与否分为三类:
  • 传统的监督学习(Traditional Supervised Learning)
每一个训练数据都有对应的标签。

支持向量机(Support Victor Motion)、人工神经网络(Neural Networks)、深度神经网络(Deep Neural Networks)。

  • 非监督学习(Unsupervised Learning)

所有的训练数据都没有对应的标签。

如图,左边的图像,⭕代表一类,❌代表一类。右边的图像总,假设有这些训练的数据,但不知道这些训练数据的标签。所以就需要假设同一类的训练数据在空间中的距离更近。

聚类(Classtery)、EM算法(Expectation-Maximization algorithm)、主成分分析(Principle Component Analysis)

  • 半监督学习(Seme Supervised Learning)

训练数据中一部分有标签,另一部分没标签。

利用少量的标注数据和大量没有标注过的数据一起训练。

如图,左边的图中,如果只有两个标注过的训练样本,我们并不知道如何进行分类。但是如果我们增加一些没有标签的训练样本,如右图所示,那么我们可能设计算法更准确的实现分类。

另一种分类方法是基于标签的固有属性。
  • 分类(Classification)

标签是离散的值。

如识别一张人脸是一堆人脸中的哪一个。

  • 回归(Regression)

标签是连续的值。

如预测房价,预测股票的价格等。

强化学习(Reinforcement Learning)

经验E是由计算机与环境相互的互动获得的。

计算机产生行为同时获得这个行为的结果,程序只需要定义这些行为的收益函数,对行为进行奖励和惩罚。同时需要设计算法,让计算机自动的通过改变自己的行为模式去最大化收益函数,完成学习的过程。


三、机器学习算法的过程

拿到数据之后,构建机器学习算法的第一步是观察数据,总结规律。如果我们总结对数据没有感性的认识,我们就很难设计出好的算法,也很难估计算法可能达到的性能极限。

错误做法:认为只要收集足够多的数据,从网上随便下载一个开源的算法模型,直接将数据丢到算法模型当中去训练,就可能获得很好的结果。

如图,可能被观察到的区别,总结起来包括如下三个方面:

  1. 平均来说,白细胞的面积比红细胞更大。
  2. 平均来说,白细胞没有红细胞那么圆。
  3. 白细胞内部的纹理比红细胞要粗糙一些。

机器学习的第一步

特征提取(Feature Extraction)

特征提取是指通过训练样本获得对机器学习任务有帮助的多个维度的特征数据。

首先特征的提取和特征选择,不同的任务提取特征的方式有不同。基于特征构建算法。不同的算法会对特征空间做不同的划分,获得不同的结果。

例如,支持向量机(Support Victor Motion)

支持向量机有三至内核:线性内核、多项式内核、高斯镜像奇函数核。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/462932.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

无人机维护保养、部件修理更换技术详解

无人机作为一种精密的航空设备,其维护保养和部件修理更换是确保飞行安全、延长使用寿命的重要环节。以下是对无人机维护保养、部件修理更换技术的详细解析: 一、无人机维护保养技术 1. 基础构造理解: 熟悉无人机的基本构造,包括…

HCIP--以太网交换安全(总实验)

实验背景 假如你是公司的网络管理员,为了提高公司网络安全性,你决定在接入交换机部署一些安全技术:端口隔、端口安全、DHCP snooping、IPSG。 实验拓扑图 实验的要求: 1.在R1、R2连接在GE0/0/1和GE0/0/2接口下,均划…

Qt中的Model与View 3:从样例出发理解QStringListModel和QListView

目录 Ui文件设计如下: 初始化窗口 这里,就是一经典的例子 你可以看到,我们的环境变量是一个经典的List列表,其中承载的就是我们的字符串。我们现在来仿照着搞一个: Ui文件设计如下: 我们下面来逐一演示用…

【VSCode】配置

安装插件 C vscode-icons gdb调试 https://www.bilibili.com/video/BV15U4y1x7b2/?spm_id_from333.999.0.0&vd_sourcedf0ce73d9b9b61e6d4771898f1441f7f https://www.bilibili.com/video/BV1pU4y1W74Z?spm_id_from333.788.recommend_more_video.-1&vd_sourcedf0…

【开发心得】筑梦上海:项目风云录(10)

目录 经典代码背后的故事 贵人相助与价值创造的跳槽哲学 从甲方现场到职场晋升 经典代码背后的故事 写完上一篇故事,本来想休息一段时间,再把思路整理一下。 但是感觉前面的故事里,涉及的故事多,涉及的技术和代码少,很多小伙伴私信希望能够多一些技术和代码的分享。 好…

编译原理第一次实验报告

源代码及附件:编译原理实验一源程序及附件资源-CSDN文库实验题目 实验要求 实验设计 前两部分指出了实验的宏观把控,为了具体实施实验,我们需要预先为实验做出如下设计: 本次实验我选取了C语言的一个子集进行设计词法分析器&…

Elastix-基于ITK的医学图像配准库

作者:翟天保Steven 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 Elastix是什么? Elastix是一个广泛使用的医学图像配准库,旨在帮助研究人员和临床医生处理和分析医学影像…

清华双臂机器人扩散大模型RDT:先预训练后微调,支持语言、图像、动作多种输入

前言 通过上文介绍的GR2,我们看到了视频生成模型在机器人训练中的应用,无独有偶,和GR2差不多一个时期出来的清华RDT,其模型架构便基于视频生成架构DiT改造而成(当然,该清华团队其实也在DiT之前推出了U-ViT&#xff0c…

远程连接服务

目录 一、远程连接服务器简介 二、连接加密技术简介 三、认证阶段 四、ssh实验 1.修改ssh服务器的端口号 2.拒绝root账户远程登录 3.允许特定用户ssh登录,其他用户无法登录 4.ssh-keygen 一、远程连接服务器简介 概念: 远程连接服务器通过文字或…

YOLOv5之Common.py

文章目录 1.学习目的2.网络模型![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/67b8dbd00c9b4034ba370fc8b8a6031a.jpeg)3.common.py分析 1.学习目的 YOLOv5中最关键一个模型类 2.网络模型 3.common.py分析 # Ultralytics YOLOv5 🚀, AGPL-3.0 license…

获取Windows计算机信息的一些常用命令

一、获取Windoiws计算机基本信息 1.1、获取系统详细信息 # systeminfo的详细用法帮助命令 systeminfo /? 通过获取系统信息可以了解系统版本内容、硬件信息、域信息和补丁情况。 systeminfo 1.2、获取系统已经启动的服务 # net的详细用法帮助命令 net /? 1.2.1、获取系…

通过 codespaces + ipad 来进行算法训练

目录 零、前言 一、环境搭建 二、DockerFile 2.1 主要流程 2.2 个人模板 零、前言 最近遇到了翘不了的水课,想在课上写题,但是游戏本一个是太重,一个是续航不行,然后想到了在Ipad 上通过云IDE来码题。 一开始用的腾讯云的 C…

部署Prometheus、Grafana、Zipkin、Kiali监控度量Istio

1. 模块简介 Prometheus 是一个开源的监控系统和时间序列数据库。Istio 使用 Prometheus 来记录指标,跟踪 Istio 和网格中的应用程序的健康状况。Grafana 是一个用于分析和监控的开放平台。Grafana 可以连接到各种数据源,并使用图形、表格、热图等将数据…

深入理解Redis的四种模式

Redis是一个内存数据存储系统,支持多种不同的部署模式。以下是Redis的四种主要部署模式。 1、单机模式 单机模式是最简单的部署模式,Redis将数据存储在单个节点上。这个节点包括一个Redis进程和一个持久化存储。单机模式非常适合小型应用程序或者开发和…

uln2003驱动28BYJ-48步进电机

欢迎入群共同学习交流 时间记录:2024/11/2 一、模块解析 1.uln2003 E脚:接GND COM脚:接VCC外部电源 1-7B:输入引脚 1-7C:输出引脚,输入与输出反向 无法输出高电平,外围电路需要接上拉电路…

使用 PyCharm 构建 FastAPI 项目:零基础入门 Web API 开发

使用 PyCharm 构建 FastAPI 项目:零基础入门 Web API 开发 本文提供了一份完整的 FastAPI 入门指南,涵盖从环境搭建、依赖安装到创建并运行一个简单的 FastAPI 应用的各个步骤。通过 FastAPI 和 Uvicorn,开发者可以快速构建现代化的 Web API…

SAP ABAP开发学习——BAPI

目录 业务对象 概念 ​编辑业务对象浏览 BAPI BAPI的浏览 BAPI的调用 BAPI的确认和返回 BAPI的创建 MM/SD常用BAPI 附加:长文本修改 业务对象 概念 业务对象浏览 进入SWO3查看 双击BUS2012 双击下图上方红色位置可以看到BAPI方法的内容 BAPI BAPI(Busines…

《高频电子线路》 —— 电感三端LC振荡器

文章内容来源于【中国大学MOOC 华中科技大学通信(高频)电子线路精品公开课】,此篇文章仅作为笔记分享。 电感三端LC振荡器 基本原理(哈特莱电路) 在高频下直流电阻对交流电相阻抗无穷大,相当于开路。谐振回…

它真能替代Express?tinyhttp用速度和轻量征服开发者

它真能替代Express?tinyhttp用速度和轻量征服开发者 如果你是个 Express 粉丝,又经常为它的历史遗留问题头疼,那么有个好消息要告诉你:tinyhttp 来啦!这款专注于轻量、快速的 Web 框架正在以一种更现代的方式挑战 Expr…

【时间之外】IT人求职和创业应知【25】

目录 新闻一:AI流量变现财富峰会在深圳举办 新闻二:江苏省加快释放数据要素价值,推动数据产业发展 新闻三:全国大中城市巡回招聘温州站(民营企业专场)举办 认知决定你的赚钱能力。以下是今天可能影响你求…