机器学习从0到1

机器学习,即machine learning
感谢easyai的精彩讲解:
easyai网址

文章目录

  • 机器学习的概念
  • 机器学习的原理
  • 监督学习,非监督学习,强化学习
    • 监督学习
    • 非监督学习
    • 强化学习
  • 机器学习实操的7个步骤
    • 现在举一个具体的任务来说明这些步骤
      • 1.收集数据
      • 2.数据准备
      • 3.选择一个模型
      • 4.训练
      • 5.评估
      • 6.参数调整
      • 7.预测

机器学习的概念

什么是机器学习:
Field of study that gives computers the ability to learn without being explicitly programmed.
机器学习研究和构建的是一种特殊算法(而非某一个特定的算法),能够让计算机自己在数据中学习从而进行预测。
机器学习不是某种算法,而是很多算法的统称
比如深度学习,还有决策树,聚类,贝叶斯
深度学习的灵感来自于大脑结构和功能,即有许多的神经元互连,ANN(人工神经网络)是模拟大脑生物结构的算法。
机器学习,深度学习,人工智能三者之间的关系是:
在这里插入图片描述
机器学习的算法其实有很多
在这里插入图片描述
这些都是以后要学习的,那这么多的算法其实有共同的思路,下面来总结一下。
1.把现实生活中的问题抽象成数学模型,并且清楚模型中不同参数的作用
2.利用数学方法对这个数学模型进行求解,从而解决显示生活中的问题
3.评估这个数学模型,是否真正解决了现实生活中的问题,解决的如何?
无论什么算法,无论什么数据,基本思路都是这三步。
归纳一下就是三点:
1.建模
2.求解
3.评价

当然,从上面三点其实不难看出,第一点是最难的,如何把一个现实问题抽象成数学问题,因为不是所有的问题都可以转换成数学问题。

机器学习的原理

以监督学习为例,说明机器学习的实现原理
比如我们教小朋友识字,拿出三张卡片,小朋友看着,然后我们说一条横线的是一、两条横线的是二、三条横线的是三
在这里插入图片描述
不断地重复,小朋友的大脑也在不停地学习,当重复次数足够多时,他就学会了三个汉字一、二、三。
在这里插入图片描述
那我们的机器学习过程和上述类似,不过机器把这个过程进行划分了:
一个是训练集,一个是特征,一个是建模,以及最后的模型。
上面提到的认字的卡片在机器学习中叫——训练集
上面提到的“一条横线,两条横线”这种区分不同汉字的属性叫——特征
小朋友不断学习的过程叫——建模
学会了识字后总结出来的规律叫——模型
总结:通过训练集,不断识别特征,不断建模,最后形成有效的模型,这个过程就叫“机器学习”!
在这里插入图片描述
相信看到这里应该是都能理解的。

监督学习,非监督学习,强化学习

机器学习根据训练方法分成三类,依旧是上面提到的监督学习,非监督学习和强化学习

监督学习

指的是我们给算法一个数据集,并且给定正确答案,机器通过数据来学习正确答案的计算方法。
关键词就是数据集,正确答案,学习正确答案
比如认识动物:
在这里插入图片描述
我们有一堆的动物照片,我们使用监督学习的时候,我们需要给这些照片打上标签。然后就可以将打好标签的照片用来训练。
我们打的标签就是正确答案,机器可以通过学习,在新照片认出这些动物的类别。
在这里插入图片描述

非监督学习

非监督学习中,给定的数据集没有正确答案,所有的数据都是一样的。无监督学习的任务是从给定的数据集中,挖掘出潜在的结构。
此时我的给的照片就是这样的,没有任何标签,但是我们希望机器能将这些照片分类。
在这里插入图片描述
通过学习,机器能将这些照片分为两类,但是和监督学习有着本质的差别,那就是机器并不知道那个是狗,那个是猫。
在这里插入图片描述
对于机器来说,只是单纯的把他们分成了两类

强化学习

强化学习接近生物学习的本质,有望获得更高的智能。他关注的是智能体如何在环境中采取一系列行为,从而获得最大的累计回报,通过强化学习,一个智能体应该知道在什么状态下应该采取什么行为。
比如说打游戏。

机器学习实操的7个步骤

所有的机器学习在实操中基本都有四步:
1.收集数据
2.数据准备
3.选择一个模型
4.训练
5.评估
6.参数调整
7.预测(开始使用)
在这里插入图片描述

现在举一个具体的任务来说明这些步骤

在这里插入图片描述

1.收集数据

收集很多的啤酒和红酒,通过光谱仪和测量酒精度的设备,形成一下的数据:
在这里插入图片描述
这一步非常重要。数据的数量和质量决定了预测模型的好坏

2.数据准备

我们收集到的数据还是会有很多的问题,需要进行数据清洗等工作。
把数据分成三个部分:训练集(60%)、验证集(20%)、测试集(20%)
数据准备
以上组成了一个数据集。

3.选择一个模型

研究人员和数据科学家门创造了许多模型,有些非常适合图像数据,有些适合序列(图像or音乐),有些用于数字数据,有些用于基于文本的数据。

4.训练

训练并不是重点,数据的数量和质量、模型的选择比训练本身重要的多。

5.评估

一旦训练完成,就需要评估模型是否可用,这就是验证集和测试集的作用。评估的主要指标有准确率、召回率、F值
这个过程可以让我们看到模型如何对尚未看到的数是如何做预测的。这意味这代表模型在现实世界中的表现。

6.参数调整

完成评估后,可以用过调整参数来进一步改进训练。

7.预测

上面的所有过程都是为了这一步服务的,也是机器学习的价值。你只要告诉他酒的颜色和酒精度,他就会告诉你这是啤酒还是红酒了。

这是几种经典的机器学习算法。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/128496.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在Postman的脚本中使用pm对象获取接口的请求参数

在Postman的脚本中使用pm对象获取接口的请求参数 1、获取在Query Params中输入的参数全局变量的引用(以在header中引用为例)2、获取在Body中输入的参数3、pm对象常用用法 1、获取在Query Params中输入的参数 query params页面 在tests中写脚本做后置处…

【ArcGIS pro】-使用arcpy一次保存多个布局

在arcgis Pro中常常会创建多个地图和多个布局,本文介绍如何使用代码,一次保存多个布局文件 在arcgis pro中打开python视图 找到工程位置 在python视图中输入如下代码 保存为pdf import arcpy# 设置当前项目,这通常是一个.aprx文件 projec…

华为云云耀云服务器L实例评测|华为云耀云L搭建zerotier服务测试

0. 环境 - Win10 - 云耀云L服务器 1. 安装docker 检查yum源,本EulerOS的源在这里: cd /etc/yum.repos.d 更新源 yum makecache 安装 yum install -y docker-engine 运行测试 docker run hello-world 2. 运行docker镜像 默认配…

【广州华锐互动】AR远程协助技术提供实时远程协作和指导

随着科技的不断发展,企业的运营管理模式也在不断地进行创新和升级。在这个过程中,AR(增强现实)技术的应用逐渐成为了企业运维管理的新兴趋势。AR远程协助平台作为一种结合了AR技术和远程协助理念的技术手段,为企业运维…

信息安全技术 办公设备安全测试方法

声明 本文是学习GB-T 38558-2020 信息安全技术 办公设备安全测试方法. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 办公设备安全测试方法范围 本标准规定了办公设备安全技术要求和安全管理功能要求的测试方法。 本标准适用于测试机构、办公设备厂…

Edge浏览器没有让我失望! 今天终于可以在win10中模拟IE内核进行前端测试了!

前言 😝 ietest现在是不是不好用了? Edge浏览器仿真是不是不见了? 如图 如果我们在前端开发javascript遇见一些老旧的语法标准,想要测试一下都难,想想都抓狂!😤😤 不过不用担心,经过这几天的…

Idea上传gitee注意事项,push reject错误

一、 你在项目所在文件夹的空白处,鼠标右键,点击git bash here 会自动进入该目录下 二、 如果你遇到push reject 输入下面的命令: git pull origin master –allow-unrelated-historiesgit push -u origin master -f再次push就好了。 三、 …

wpf C# 用USB虚拟串口最高速下载大文件 每包400万字节 平均0.7s/M,支持批量多设备同时下载。自动识别串口。源码示例可自由定制。

C# 用USB虚拟串口下载大文件 每包400万字节 平均0.7s/M。支持批量多设备同时下载。自动识别串口。可自由定制。 int 32位有符号整数 -2147483648~2147483647 但500万字节时 write时报端口IO异常。可能是驱动限制的。 之前用这个助手发文件,连续发送&#xff0…

【python爬虫】批量识别pdf中的英文,自动翻译成中文上

不管是上学还是上班,有时不可避免需要看英文文章,特别是在写毕业论文的时候。比较头疼的是把专业性很强的英文pdf文章翻译成中文。我记得我上学的时候,是一段一段复制,或者碰到不认识的单词就百度翻译一下,非常耗费时间。本文提供批量识别pdf中英文的方法,后续文章实现自…

PatchMatchNet 学习笔记 译文 深度学习三维重建

9 PatchMatchNet CVPR-2021 patchmatchnet源码下载 PatchMatchNet 代码注释版 下载链接(注释非常详细,较源码结构有调整,使用起来更方便) PatchMatchNet-CVPR-2021(源码、原文+注释+译文+批注) 9.0 主要特点 金字塔,基于传统的PatchMatch算法,精度高,速度快 Pa…

后端SpringBoot+前端Vue前后端分离的项目(二)

前言:完成一个列表,实现表头的切换,字段的筛选,排序,分页功能。 目录 一、数据库表的设计 ​编辑二、后端实现 环境配置 model层 mapper层 service层 service层单元测试 controller层 三、前端实现 interface接…

网管实战⑼:配置华为S5720交换机

配置好汇聚交换机后,需要根据单位情况配置具体的接入交换机。 自从2019年12月底配置好交换机后,基本上都没有怎么操作交换机了。那时候使用的是H3C交换机,主要是H3C S7706、H3C S5120、H3C S5130、H3C S5500、H3C S3600等型号的交换机&#x…

快速排序详解

前言 快排是不稳定的排序,快排的适用场景是无序的序列,例如此时有一个数组是有序的 / 逆序的,此时的快排效率是最慢的。 过程: 找一个基准值,找的过程就以挖坑法的方式填坑,第一次排序以挖坑发填完坑之后&a…

mfc 浮动窗口

参考 MFC模拟360悬浮窗加速球窗口

yolo物体检测系列实战1:yolo-v1整体思想与网络架构

1、物体检测经典方法 two-stage(两阶段):Faster-rcnn Mask-Rcnn系列one-stage(单阶段):YOLO系列 最核心的优势:速度非常快,适合做实时检测任务!但是缺点也是有的&#x…

ue5 物理场的应用

cable mat wpo particle 流体粒子 choas 破损 刚体 布料 cloud abp blueprint riggedbody 体积雾 毛发 全局的 局部的 非均匀的 连续变化的 也可以多个叠加 从全局 到 范围 除了vector还有scalar的值也就是0--1的黑白灰的值 但是最终输出的值的类型还是取决于这个 一…

渗透测试漏洞原理之---【不安全的反序列化】

文章目录 1、序列化与反序列化1.1、引入1.2、序列化实例1.2.1、定义一个类1.2.2、创建 对象1.2.3、反序列化1.2.4、对象注入 2、漏洞何在2.1、漏洞触发2.1.2、定义一个类2.1.3、定义一个对象2.1.3、反序列化执行代码 2.2 为什么会这样 3、反序列化漏洞攻防3.1、PHP反序列化实例…

51单片机的简易计算器数码管显示仿真设计( proteus仿真+程序+原理图+报告+讲解视频)

51单片机的简易计算器数码管显示仿真设计 1.主要功能:2.仿真3. 程序代码4. 原理图5. 设计报告6. 设计资料内容清单&&下载链接 51单片机的简易计算器数码管显示仿真设计( proteus仿真程序原理图报告讲解视频) 仿真图proteus7.8及以上 程序编译器…

MySQL主从分离读写复制

在高负载的生产环境里,把数据库进行读写分离,能显著提高系统的性能。下面对MySQL的进行读写分离。 试验环境 A机:IP:192.168.0.1 mysql版本:mysql-5.6.4,主数据服务器(只写操作) B机:IP:192.…

智慧公厕破解公共厕所管理的“孤岛现象”

在现代社会中,公共厕所是城市管理中的一项重要任务。然而,经常会出现公厕管理的“孤岛现象”,即每个公厕都是独立运作,缺乏统一的管理和监控机制。针对这一问题,智慧公厕的出现为解决公共厕所管理难题带来了新的方案。…