机器学习基本概念介绍 2023

笔记来源于:

https://www.youtube.com/watch?v=phQK8xZpgoU&t=172s

https://www.youtube.com/watch?v=XLyPFnephpY&t=645s

Machine/Deep Learning

机器学习概况来说,让机器具备自动找函式的能力 (Machine Learning 约等于 Looking for function)

三种机器学习: 回归,分类,生成式学习

函数输出来进行分类

1、 回归: 韩式的输出是一个数值

例子:预测明天的PM2.5值

2、分类:函式的输出是一个类别(选择题)

例子:email过滤垃圾邮件,让机器做一个选择题

输入是邮件,输出是垃圾邮件/不是垃圾邮件

机器学习有一个更困难的问题: 结构化学习(Structured Learning),让机器生成有结构的物件,例如影像,文字,又叫生成式学习(Generative Learning)

结构化学习,生成式学习是一门很难的技术,不知道什么时候才能达到生成式学习

不知道什么时候才能到达暗黑大陆

ChatGPT是哪一类呢?

chatgpt实际做的事情: 文字接龙,模型解的是分类的问题

使用者感受到的功能: 一个字一个字生成,可能感受到的是生成式学习

实际上,chatgpt要解的是生成式学习这个问题做下简化,拆解成多个分类问题

生成式学习有很多个策略,有哪些?

机器学习就是让机器找一个函式,那机器怎么找?

0

归纳成三个步骤,比较好理解

前置作业: 决定要找什么样的函式,这个和技术无关,取决于你要做什么样的应用

例子: 宝可梦,提升战斗力,或者判断是否是宝可梦

1、 设定范围

找出候选函数的集合,就是model

深度学习中,类神经网络的结构,例如CNN,RNN,Transformer等,指的就是不同的函式集合

0

为什么类神经网络的结构就是一个候选函式的集合?

视频解析: https://www.youtube.com/watch?v=Dr-WRlEFefw

参考资料:https://ruanyifeng.com/blog/2017/07/neural-network.html

近年来,计算机视觉慢慢由CNN转向transform的趋势

0

step1: 这个function其实就是一个Neural network

我们把一个Logistic Regression 称之为Neuron,整个称之为Neural Network。 也就是一个Neural network里面包含一大堆的Logistic Regression

每个Logistic Regression,它都有自己的weight和自己的bias,这些weight和bias集合起来,就是这个network的parameter

0

如何去连接不同的Neuron network? Full Connect Feedforward Network

通过不同的连接方式,就得到了不同的structure

0

1*1+(-1)*(-2)再加上bias 1,通过sigmoid function以后,计算得到值

0

一个neural network你可以把它看作是一个function,input是一个vector,output也是一个vector

如果不知道参数 weight和bias,只是定出了这个network的structure,只是定义好了这个network怎么样连接,

它其实就是定义了一个function set,我们可以给这个network设定不同的参数,它就变成了不同的function,把这些可能的function集合起来

我们就得到了一个function set

0

0

为什么我们要设定范围? 为什么我们要选出候选函式的范围? 为什么不把所有的函式纳入进来?

1、标准训练数据下,loss小,但是测试不好,例如是硬记答案,我们要找在各个环境都表现很好的函式。。。

2、 过滤掉不行的函式,所以一开始划定范围,不在这个范围的直接淘汰,这个范围也很有讲究。。。

3、这个范围选择有标准的数学理论支撑,参见视频:

卷积神经网络:https://www.youtube.com/watch?v=OP5HcXJg2Aw

浅谈机器学习原理:https://www.youtube.com/watch?v=_j9MVVcvyZI

0

2、 设定标准

设定一个评估函式好坏的标准

怎么设定一个最好的标准,loss越小,代表函数最好,loss越大,代表不好

这个loss设定怎么来呢? 自己来设置

例子:宝可梦,战斗力

专业人士设置标准答案,根据函式的输出和标准答案的差距,所有的差距加起来代表函式的好坏

0

L(f1)=15 入参为函式,大L也是一个函式,用来计算函式的好坏

怎么样来定义这个loss function?

假设有另外的情况,有部分的数据有标准答案,路边抓过来一些宝可梦,那怎么来评估战斗力?这种情况下

怎么来评估这些没有正确标注的宝可梦的战斗力?

第一步,把宝可梦丢到这个函式里面,如果有返回,则使用

没有的话,我们可以定一些假设,长得像宝可梦的战斗力要一样

(那怎么定义长得像呢? 比如像素的相似度 这个你自己来根据资料来灵活定义)

一个好的函式,可以评估出没有标注过的数据

0

问题: 在训练数据上面评估的loss函数小,但是在训练数据上面不一定好

0

可能的原因是什么呢?

1、 数据量太小

2、有很多其他的理论知识。。。。

怎么解决?

我们在Loss上做一些额外的考量,如Regularization,具体做法原理视频没讲。。。。。。。

3、 达成目标

找出最好的函式,什么叫做好呢? 就是上面的loss,loss越小,函式越好

这个找出函式最佳的方式叫做Optimization

0

0

如何进一步去找最好评估的loss函式,可以学习下这几个视频。。。我没来的及学习

0

最佳化演算法

什么是达成目标比较好的方式?

把最佳化演算法看作一个巨大的funciton,输入是定义好的函式集合 H和评估函式好坏的标准L,

输出一个最好的函式,这个函式在大L里面的值越小越好

怎么评估这个function的好坏?

1、 我们期待这个function能够在同样输入H和L的前提下,越快输出越好

2、有时候需要L(f*)越小越好,但是通常找不出大L最低的function(不清楚为啥。。。。),但是我们期待最佳化演算法找出来的L(f*) 越低越好

0

我们需要先设定 Learning Rate,Batch Size,How to Init,这些就叫做超参数,纯手工去调(技术活)

参数狗。。。 不是类神经网络里面的参数

0

一个好的最佳化演算法,我们期待最佳化演算法对于超参数不敏感。。。。这样就可以用预设值了

--------------------------------------------------------------------------------------------------------------------------------

0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/214211.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[足式机器人]Part2 Dr. CAN学习笔记-数学基础Ch0-6复数Complex Number

本文仅供学习使用 本文参考: B站:DR_CAN Dr. CAN学习笔记-数学基础Ch0-6复数Complex Number x 2 − 2 x 2 0 ⇒ x 1 i x^2-2x20\Rightarrow x1\pm i x2−2x20⇒x1i 代数表达: z a b i , R e ( z ) a , I m ( z ) b zabi,\mathrm{Re}…

Vue脚手架 生命周期 组件化开发

Vue脚手架 & 生命周期 & 组件化开发 一、今日目标 1.生命周期 生命周期介绍生命周期的四个阶段生命周期钩子声明周期案例 2.综合案例-小黑记账清单 列表渲染添加/删除饼图渲染 3.工程化开发入门 工程化开发和脚手架项目运行流程组件化组件注册 4.综合案例-小兔…

计算机网络之IP篇

来源自小林Coding博客,阅读后部分精简笔记 目录 一、IP 的基本认识 二、DNS 三、ARP 四、DHCP 五、NAT 六、ICMP 七、IGMP 七、ping 的工作原理 ping-----查询报文的使用 traceroute —— 差错报文类型的使用 八、断网了还能 ping 通 127.0.0.1 吗&…

十一、了解分布式计算

1、什么是(数据)计算? 2、分布式(数据)计算 (1)概念 顾名思义,分布式计算,即以分布式的形式完成数据的统计,得到需要的结果。 分布式数据计算,顾名思义,就是…

基于PLC的锅炉燃烧控制系统设计 (论文+源码)

1.系统设计 由图3.1可以看出,煤炭进入煤炭输送装置,直接落入缓慢移动的炉排中的燃烧室。对流烟道被烟雾隔离。对流烟道设置有加热表面,例如对流管束。对流管是连接到上部和下部气缸的一束管。管道中的水吸收烟道中的热量并加热。在上鼓中加热…

VINS-MONO代码解读5----vins_estimator(marginalization部分)

文章目录 0. 前言1.1 Marginalization Pipiline 1. marg factor构建1.1 变量及维度理解1.2 IMUFactor1.3 ProjectionTdFactor(ProjectionFactor)1.4 MarginalizationFactor( e p e_p ep​推导更新,FEJ解决的问题)1.4.1 先验残差的更新1.4.2 先验Jacobian的更新 2. R…

Java网络通信-第21章

Java网络通信-第21章 1.网络程序设计基础 网络程序设计基础涵盖了许多方面,包括网络协议、Web开发、数据库连接、安全性等。 1.1局域网与互联网 局域网(LAN)与互联网(Internet)是两个不同的概念,它们分…

Redis Reactor事件驱动模型源码

前置学习:Redis server启动源码-CSDN博客 Redis采用单线程Reactor模型 三个关键角色,即 reactor、acceptor、handler 三类处理事件,即连接事件、写事件、读事件。 建立连接(Acceptor)、监听accept、read、write事件…

测试命题 cuda kernel 和 cudaMemcpy 是异步执行

前置命题,保序的命题: 同一个任意的stream中的gpu操作(memcpy和kernel),在gpu内部都是严格保序的,即,前一个gpu任务结束后才会执行下一个任务。 测试两个命题: 1,cuda …

python画动漫形象(魔法少女小圆晓美焰,super beautiful)

1.源代码 import turtle as te import time WriteStep 15 # 贝塞尔函数的取样次数 Speed 5 Width 600 # 界面宽度 Height 500 # 界面高度 Xh 0 # 记录前一个贝塞尔函数的手柄 Yh 0 def Bezier(p1, p2, t): # 一阶贝塞尔函数 return p1 * (1 - t) p2 * t def Bezier_2(x1…

JVM 性能调优及监控诊断工具 jps、jstack、jmap、jhat、jstat、hprof 使用详解

目录 一. 前言 二. jps(Java Virtual Machine Process Status Tool) 三. jstack 四. jmap(Memory Map)和 jhat(Java Heap Analysis Tool) 五. jstat(JVM统计监测工具) 六. hpro…

MySQL系列(一):索引篇

为什么是B树? 我们推导下,首先看下用哈希表做索引,是否可以满足需求。如果我们用哈希建了索引,那么对于如下这种SQL,通过哈希,可以快速检索出数据: select * from t_user_info where id1;但是这…

logback日志框架使用

依赖引入 <dependency><groupId>ch.qos.logback</groupId><artifactId>logback-classic</artifactId><version>1.1.7</version> </dependency> 使用logback日志框架只需要引入以上即可&#xff0c;(我们平时使用较多的Slf4j…

Python爬虫-实现批量抓取王者荣耀皮肤图片并保存到本地

前言 本文是该专栏的第12篇,后面会持续分享python爬虫案例干货,记得关注。 本文以王者荣耀的英雄皮肤为例,用python实现批量抓取“全部英雄”的皮肤图片,并将图片“批量保存”到本地。具体实现思路和详细逻辑,笔者将在正文结合完整代码进行详细介绍。注意,这里抓取的图片…

SpringMVC修炼之旅(3)REST风格与拦截器

一、概述 1.1简介 Restful就是一个资源定位及资源操作的风格。不是标准也不是协议&#xff0c;只是一种风格。基于这个风格设计的软件可以更简洁&#xff0c;更有层次&#xff0c;更易于实现缓存等机制。 1.2功能 资源&#xff1a;互联网所有的事物都可以被抽象为资源 资源操作…

ELK 日志解决方案

ELK 是目前最流行的集中式日志解决方案&#xff0c;提供了对日志收集、存储、展示等一站式的解决方案。 ELK 分别指 Elasticsearch、Logstash、Kibana。 Elasticsearch&#xff1a;分布式数据搜索引擎&#xff0c;基于 Apache Lucene 实现&#xff0c;可集群&#xff0c;提供…

本地搭建Linux DataEase数据可视化分析工具并实现公网访问

文章目录 前言1. 安装DataEase2. 本地访问测试3. 安装 cpolar内网穿透软件4. 配置DataEase公网访问地址5. 公网远程访问Data Ease6. 固定Data Ease公网地址 前言 DataEase 是开源的数据可视化分析工具&#xff0c;帮助用户快速分析数据并洞察业务趋势&#xff0c;从而实现业务…

软件工程复习

一、题型 单项选择题 20分 填空题 10分 判断题 10分 简答题 18分 应用题 12分 综合题 30分 软件程序数据文档 软件是无形的、不可见的逻辑实体 20世纪60年代末爆发软件危机 软件危机是指软件在开发与维护过程中遇到的一系列严重的问题 …

Mac安装Anaconda3最新实用教程

Anaconda3安装 1、Anaconda3下载 我用的是这个链接&#xff1a;https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 可以按需要选择自己需要的版本&#xff0c;也可以自行搜索其他网站下载 下载完成之后一路默认安装就可以了。 安装好之后可以在终端试一下&#xff1a;…

JS基础之原型原型链

JS基础之原型&原型链 原型&原型链构造函数创建对象prototypeprotoconstructor实例与原型原型的原型原型链其他constructorproto继承 原型&原型链 构造函数创建对象 我们先使用构造函数创建一个对象&#xff1a; function Person(){ } var person new Person();…