【深度学习笔记】回归与分类

回归与分类

1 Logistic 回归

  1. 定义

    目标:给定数据点 X ( n ) ∈ R m X^{(n)}∈R^m X(n)Rm 和相应标签 t ( n ) ∈ Ω t^{(n)}∈Ω t(n)Ω ,找到一个映射 f : R m → Ω f:R^m→Ω f:RmΩ

    • 回归的目的是预测一个连续的数值变量,如果Ω是一个连续的集合称其为回归(regression)
    • 分类的目的是将数据划分为离散的类,如果Ω是一个离散的集合称其为分类(classification)
  2. 回归类型

    • 线性回归:用于建立因变量和自变量之间线性关系的统计方法
      f ( x ) = w x + β f(x) =w x + \beta f(x)=wx+β
      其中, y y y是因变量, x 1 , x 2 , ⋯ , x n x_1, x_2, \cdots, x_n x1,x2,,xn是自变量, β 0 , β 1 , ⋯ , β n \beta_0, \beta_1, \cdots, \beta_n β0,β1,,βn是回归系数。

    • 多项式回归:多项式回归是一种扩展了线性回归的方法,它可以拟合因变量和自变量之间的非线性关系。
      f ( x ) = β + w 1 x + w 2 x 2 + w 3 x 3 + ⋯ + w m x m f(x) = \beta + w_1 x + w_2 x^2 + w_3 x^3 + \cdots + w_m x^m f(x)=β+w1x+w2x2+w3x3++wmxm
      其中, m m m是多项式的最高次数。

    通过均方误差 ( M S E = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 MSE = \frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2 MSE=n1i=1n(yiy^i)2)进行训练,得到最终的 f ( x ) f(x) f(x)

  3. 分类方法

    • 线性回归分类:感知机、SVM

    • 非线性回归分类:sigmoid function
      f ( x ) = 1 1 + e − x f(x) = \frac{1}{1+e^{-x}} f(x)=1+ex1
      image-20240124165916191

    • 伯努利分布假设
      P ( x ) = { p , x = 1 1 − p , x = 0 P(x)=\begin{cases}p,x=1\\ 1-p,x=0 \end{cases} P(x)={p,x=11p,x=0

  4. Logistic 回归

    Logistic 回归是一种用于二分类问题的模型,它可以预测一个离散输出,例如0或1。

    • Logistic回归函数

      对于二分类问题,一个0-1单元足以表示一个标签
      P ( t = 1 ∣ x ) = 1 1 + e − θ ⊤ x ≜ h ( x ) P(t=1|x)=\frac{1}{1+e^{-θ^\top x}}\triangleq h(x) P(t=1∣x)=1+eθx1h(x)
      其中 x x x是输入, t t t 是标签, θ θ θ 是参数。我们的目标是寻找一个 θ θ θ值使得概率 P ( t = 1 ∣ x ) = h ( x ) P(t=1|x)=h(x) P(t=1∣x)=h(x)​。

      我们实质上是在用另一个连续函数来“回归”一个离散的函数(x→t)

    • 最大化条件数据似然

      最大化条件数据似然是一种参数估计方法,它利用已知的数据和条件分布,找到最有可能(即最大概率)导致这种分布的参数值。

      将t看作一个伯努利变量,并且 P ( t = 1 ∣ x ) = h ( x ; θ ) P(t=1|x)=h(x;\theta) P(t=1∣x)=h(x;θ)​。条件似然函数为
      P ( t ( 1 ) , . . . , t ( n ) ∣ X ; θ ) = ∏ n = 1 N h ( x ( n ) ) t ( n ) ( 1 − h ( x ( n ) ) 1 − t ( n ) P(t^{(1)},...,t^{(n)}|X;\theta)=\prod_{n=1}^{N}h(x^{(n)})^{t^{(n)}}(1-h(x^{(n)})^{1-t^{(n)}} P(t(1),...,t(n)X;θ)=n=1Nh(x(n))t(n)(1h(x(n))1t(n)
      最大化似然等同于最小化下式:
      E ( θ ) = − 1 n l n P ( t ( 1 ) , . . . , t ( n ) ) = − 1 n ∑ n = 1 n ( t ( n ) l n h ( x ( n ) + ( 1 − t ( n ) ) l n ( 1 − h ( x ( n ) ) ) E(θ)=-\frac{1}{n}lnP(t^{(1)},...,t^{(n)})=-\frac{1}{n}\sum^{n}_{n=1}\left(t^{(n)}ln\ h(x^{(n)}+(1-t^{(n)})ln\ (1-h(x^{(n)})\right) E(θ)=n1lnP(t(1),...,t(n))=n1n=1n(t(n)ln h(x(n)+(1t(n))ln (1h(x(n)))

    • 交叉熵误差函数

      对于带有二元标签的一组训练样本 { ( x ( n ) , t ( n ) ) : n = 1 , . . . , N } \{(x^{(n)},t^{(n)}):n=1,...,N\} {(x(n),t(n)):n=1,...,N},定义交叉熵误差(cross-entropyerror)函数
      E ( θ ) = − 1 n l n P ( t ( 1 ) , . . . , t ( n ) ) = − 1 n ∑ n = 1 n ( t ( n ) l n h ( x ( n ) + ( 1 − t ( n ) ) l n ( 1 − h ( x ( n ) ) ) E(θ)=-\frac{1}{n}lnP(t^{(1)},...,t^{(n)})=-\frac{1}{n}\sum^{n}_{n=1}\left(t^{(n)}ln\ h(x^{(n)}+(1-t^{(n)})ln\ (1-h(x^{(n)})\right) E(θ)=n1lnP(t(1),...,t(n))=n1n=1n(t(n)ln h(x(n)+(1t(n))ln (1h(x(n)))

  5. 训练和测试

    • 计算梯度
      ∇ E ( θ ) = 1 N ∑ N x ( n ) ( h ( x ( n ) ) − t ( n ) ) \nabla E(\theta)=\frac{1}{N}\sum_Nx^{(n)}(h(x^{(n)})-t^{(n)}) E(θ)=N1Nx(n)(h(x(n))t(n))

    • 一些正则化项添加到成本函数中
      J ( θ ) = E ( θ ) + λ ∣ θ ∣ 2 / 2 J(\theta)=E(\theta)+\lambda|\theta|^2/2 J(θ)=E(θ)+λθ2/2

    • 训练:学习θ来最小化成本函数,其中 α \alpha α是学习率。
      θ ← θ − α ∇ J ( θ ) \theta \leftarrow \theta-\alpha \nabla J(\theta) θθαJ(θ)

    • 测试:对于新的输入 x x x,如果 P ( t = 1 ∣ x ) > P ( t = 0 ∣ x ) P(t=1|x)>P(t=0|x) P(t=1∣x)>P(t=0∣x),则可以预测输入为类别1,否则就是类别0。

2 Softmax 回归

  1. 类别标签的表示

    one-hot编码(1-of-K):将离散的类别标签转换为向量形式,其中每个类别都由一个唯一的二进制值表示。

    对于一个具有 K K K 个可能类别的问题,1-of-K 表示法将每个类别映射为一个长度为 K K K 的二进制向量,其中只有一个元素为1,其余为0。被设置为1的位置对应于类别的索引。

    例如,对于一个三类分类问题( K = 3 K = 3 K=3),类别A、B和C可能被表示为:

    • 类别A: 1 , 0 , 0 1, 0, 0 1,0,0
    • 类别B: 0 , 1 , 0 0, 1, 0 0,1,0
    • 类别C: 0 , 0 , 1 0, 0, 1 0,0,1
    • 唯一性: 每个类别的表示是唯一的,因为只有一个元素为1。
    • 独立性: 每个类别的表示与其他类别的表示是相互独立的,不存在冗余信息。
  2. 分布假设

    • 正态分布假设

      正态分布假设是指假设数据集服从正态分布的概率分布。
      f ( x ; μ , σ ) = 1 2 π σ 2 exp ⁡ ( − ( x − μ ) 2 2 σ 2 ) f(x; \mu, \sigma) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right) f(x;μ,σ)=2πσ2 1exp(2σ2(xμ)2)
      其中, μ \mu μ 是均值(分布的中心), σ \sigma σ 是标准差(度量分布的离散程度)。

    • Multinoulli分布假设

      Multinoulli分布假设描述了离散型随机变量的概率分布,特别适用于多类别分类问题。

      对于一个给定的样本,其类别的概率分布可以由参数 ϕ k \phi_k ϕk 来表示。对于一个离散型随机变量 X X X 表示类别的取值,其概率质量函数如下:
      P ( X = k ) = ϕ k P(X=k) = \phi_k P(X=k)=ϕk
      这表示样本属于类别 k k k 的概率为 ϕ k \phi_k ϕk

  3. Softmax 函数

    Softmax回归,也称为多类逻辑回归或多类交叉熵分类,是一种用于多类别分类的模型。

    假设有 K K K 个类别,对于输入特征向量 x x x​ ,Softmax回归的模型表达式如下:
    P ( y = k ∣ x ) = e w k ⋅ x + b k ∑ j = 1 K e w j ⋅ x + b j P(y=k \mid x) = \frac{e^{w_k \cdot x + b_k}}{\sum_{j=1}^{K} e^{w_j \cdot x + b_j}} P(y=kx)=j=1Kewjx+bjewkx+bk
    其中, P ( y = k ∣ x ) P(y=k \mid x) P(y=kx) 是给定输入 x x x 属于类别 k k k 的概率。$ w_k $ 和 $ b_k $ 是模型的参数,分别表示第 k k k个类别的权重和偏置。

  4. 最大条件似然

    最大条件似然的目标是找到一组参数,使得在给定输入 x x x 的条件下,观察到实际类别 y y y 的概率最大。Softmax 回归的最大条件似然目标函数为:
    P ( t ( 1 ) , . . . , t ( N ) ∣ X ) = ∏ n = 1 N ∏ k = 1 K P ( t k ( n ) = 1 ∣ x ( n ) ) t k ( n ) P(t^{(1)},...,t^{(N)}|X)=\prod_{n=1}^N\prod_{k=1}^KP(t_k^{(n)}=1|x^{(n)})^{t_k^{(n)}} P(t(1),...,t(N)X)=n=1Nk=1KP(tk(n)=1∣x(n))tk(n)
    其中:

    • N N N 是样本数量。
    • t k ( n ) t_k^{(n)} tk(n) 是one-hot函数,当 t k t_k tk 等于 k k k 时为1,否则为0。
  5. 交叉摘误差函数

    Softmax回归通常使用交叉熵损失函数来衡量模型预测与实际类别之间的差异。对于 N N N​ 个样本,交叉熵损失函数的表达式为:
    J ( w , b ) = − 1 N ∑ i = 1 N ∑ k = 1 K t k ( n ) ln ⁡ P ( t k ( n ) = 1 ∣ x ( n ) ) J(w, b) = -\frac{1}{N} \sum_{i=1}^{N} \sum_{k=1}^{K} t_k^{(n)} \ln P(t_k^{(n)}=1|x^{(n)}) J(w,b)=N1i=1Nk=1Ktk(n)lnP(tk(n)=1∣x(n))
    其中:

    • $J(w, b) $ 是损失函数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/261415.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jenkins的nmp install命令无法下载包

问题:在jenkin的流水线脚本中执行到:npm install命令后无法下载前端依赖包 1、进到jenkins的工作目录,一般在底层为/var/lib/jenkins/workspace/任务名称 cd /var/lib/jenkins/workspace/xkc处理方式: # 查看镜像源 npm config …

Redis篇----第十二篇

系列文章目录 文章目录 系列文章目录前言一、一个 Redis 实例最多能存放多少的 keys?List、Set、Sorted Set 他们最多能存放多少元素二、MySQL 里有 2000w 数据,redis 中只存 20w 的数据,如何保证 redis 中的数据都是热点数据?三、Redis 最适合的场景?前言 前些天发现了一…

游戏配置二级缓存一致性问题解决方案

游戏服务器进程在启动的时候,一般会把所有策划配置数据加载到内存里,将主键以及对应的记录存放在一个HashMap容器里,这称为一级缓存。部分功能可能还需要缓存其他数据,这些称为二级缓存。举个例子,对于如下的玩家升级表…

如何删除PS最近使用项

ps删除最近文件列表 点击菜单栏中文件->最近打开文件->清除最近的文件列表

【OpenSSH+Jenkins搭建项目自动化部署】

OpenSSHJenkins搭建项目自动化部署 一、Windows安装OpenSSH1.下载2.解压3.安装4.启停服务5.SSH免密登录 二、Jenkins安装1.下载2.安装启动3.登录 三、项目自动化部署1.SSH配置2.项目配置3.权限控制 一、Windows安装OpenSSH 1.下载 https://github.com/PowerShell/Win32-0penS…

如何修改docker容器的端口映射

要修改 Docker 容器的端口映射&#xff0c;你需要停止并删除现有的容器&#xff0c;然后使用新的端口映射重新运行容器。以下是详细步骤&#xff1a; 停止容器&#xff1a; 使用 docker stop 命令停止正在运行的容器。替换 <container_id> 为你要停止的容器的 ID 或者容器…

SVN忽略已提交的文件(ignore,移出版本控制)

本文适用于已安装TortoiseSVN客户端的同学。 1、右键点击要忽略的文件夹或文件&#xff0c;鼠标移到“TortoiseSVN”&#xff0c;找到“Unversion and add to ignore list”&#xff0c;选择文件夹&#xff0c;弹出提示框确认忽略。 2、设置完忽略文件后&#xff0c;还需要做…

微信小程序uniapp校园在线报修系统维修系统java+python+nodejs+php

管理员的主要功能有&#xff1a; 1.管理员输入账户登陆后台 2.个人中心&#xff1a;管理员修改密码和账户信息 3.用户管理&#xff1a;对注册的用户信息进行删除&#xff0c;查询&#xff0c;添加&#xff0c;修改 4.维修工管理&#xff1a;对维修工信息进行添加&#xff0c;修…

合金电阻器与新兴技术的融合:引领电子行业的下一波浪潮?

随着电子行业以前所未有的速度向创新迈进&#xff0c;合金电阻器与尖端技术的集成证明了电子元件的动态特性。本文探讨了合金电阻器与新兴技术的融合&#xff0c;开创了功能化、小型化和效率化的新时代。 1. 与IoT&#xff08;物联网&#xff09;集成&#xff1a; 合金电阻器在…

Spring IoC容器详解

版权声明 本文原创作者&#xff1a;谷哥的小弟作者博客地址&#xff1a;http://blog.csdn.net/lfdfhl 基本概念 Spring IoC容器是Spring框架的核心组件&#xff0c;它实现了控制反转&#xff08;Inversion of Control&#xff0c;IoC&#xff09;的设计原则。IoC是一种编程思…

IDEA2023.3.4开启SpringBoot项目的热部署【简单明了4步操作】

添加devtools依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-devtools</artifactId><scope>runtime</scope><optional>true</optional> </dependency>IDEA开启自动编译 …

Vue路由缓存问题

路由缓存问题的产生 VueRouter允许用户在页面中创建多个视图&#xff08;多级路由&#xff09;&#xff0c;并根据路由参数来动态的切换视图。使用带参数的路由时&#xff0c;相同的组件实例将被重复使用。因为两个路由都渲染同一个组件&#xff0c;比起销毁再创建&#xff0c;…

QFileDialog文件选择对话框

QFileDialog 类是 Qt 框架中用于处理文件对话框的一个类&#xff0c;它继承自 QDialog。QFileDialog 提供了标准的文件选择对话框&#xff0c;使用户能够选择文件或目录。这个类可以用于打开或保存文件&#xff0c;也可以用来选择目录。 主要功能 打开和保存文件&#xff1a;…

单体微服务K8S笔记

单体微服务K8S笔记 https://blog.csdn.net/m0_48341969/article/details/126063832思路参考以上博客 //测试 https://gitee.com/yangbuyi/yi项目组织参考以上git 单体&#xff1a; 不特地介绍 微服务&#xff1a; rpc:远程过程调用 拆分&#xff0c;分别部署&#xff0…

qtday2作业

思维导图 使用手动连接&#xff0c;将登录框中的取消按钮使用qt4版本的连接到自定义的槽函数中&#xff0c;在自定义的槽函数中调用关闭函数 将登录按钮使用qt5版本的连接到自定义的槽函数中&#xff0c;在槽函数中判断ui界面上输入的账号是否为"admin"&#xff0c;…

如何用微软画图把1280X720的图片压缩成4:3?

最近在看20多年前的电视剧&#xff0c;视频截图是1280X720&#xff0c;比例失调。 如何压缩成4:3&#xff1f; 4 / 3 W / 720 W 720 X 4 / 3 960 打开画图&#xff0c;调整大学和扭曲&#xff08;Ctrl W&#xff09;&#xff0c;依据选择像素&#xff0c;取消保持纵横比…

分享:大数据信用查询去什么样的平台查?

在当今社会&#xff0c;大数据信用查询已经成为企业和个人了解自身信用状况的重要途径。然而&#xff0c;面对众多的大数据信用查询平台&#xff0c;如何选择一个可靠的平台进行查询呢?本文将为您介绍一些选择大数据信用查询平台的关键因素。 一、平台信誉度 首先&#xff0c;…

各种手型都合适,功能高度可定制,雷柏VT9PRO mini和VT9PRO游戏鼠标上手

去年雷柏推出了一系列支持4KHz回报率的鼠标&#xff0c;有着非常敏捷的反应速度&#xff0c;在游戏中操作体验十分出色。尤其是这系列4K鼠标不仅型号丰富&#xff0c;而且对玩家的操作习惯、手型适应也很好&#xff0c;像是VT9系列就主打轻巧&#xff0c;还有专门针对小手用户的…

网站管理新利器:免费在线生成 robots.txt 文件!

&#x1f916; 探索网站管理新利器&#xff1a;免费在线生成 robots.txt 文件&#xff01; 你是否曾为搜索引擎爬虫而烦恼&#xff1f;现在&#xff0c;我们推出全新的在线 robots.txt 文件生成工具&#xff0c;让你轻松管理网站爬虫访问权限&#xff0c;提升网站的可搜索性和…

【Redis】理论进阶篇------浅谈Redis的缓存穿透和雪崩原理

一、缓存穿透 1、概念 缓存穿透&#xff08;查不到数据&#xff09;&#xff0c;是指当用户想要查询数据的时候&#xff0c;会先去Redis中取命中&#xff0c;如果Redis中没有该数据&#xff0c;那么就会向数据库中去查找数据。如果数据库中也没有&#xff0c;则该次查询结果失…