机器学习:基于梯度下降算法的逻辑回归实现和原理解析

这里写目录标题

  • 什么是逻辑回归?
    • Sigmoid函数
    • 逻辑回归
    • 损失函数
    • 梯度下降
  • 逻辑回归定义
    • 逻辑函数
    • 线性组合
    • 模型训练
    • 决策边界
  • 了解逻辑回归:从原理到实现
    • 什么是逻辑回归?
    • 逻辑回归的原理
    • 逻辑回归的实现
    • 逻辑回归的应用
    • 代码示例
    • 算法可视化

当涉及到二元分类问题时,逻辑回归是一种常用的机器学习算法。它不仅简单而且有效,通常是入门机器学习领域的第一步。本文将介绍逻辑回归的基本概念、原理、应用场景和代码示例。
在这里插入图片描述

什么是逻辑回归?

逻辑回归是一种用于解决二元分类问题的统计学习方法。尽管其名称中包含"回归"一词,但实际上它是一种分类算法。逻辑回归的目标是预测输入变量与某个特定类别相关联的概率。

在逻辑回归中,我们使用一个称为Sigmoid函数的特殊函数来执行这种概率预测。Sigmoid函数的形状类似于"S"型曲线,它将输入的线性组合映射到0到1之间的概率值。

Sigmoid函数

Sigmoid函数的数学表达式如下:
在这里插入图片描述

其中,
z z z 表示输入的线性组合。Sigmoid函数的输出范围在0到1之间,这使得它非常适合用于表示概率。

逻辑回归

在这里插入图片描述

损失函数

在这里插入图片描述

梯度下降

在这里插入图片描述

逻辑回归定义

逻辑函数

逻辑回归使用一种称为逻辑函数(Logistic Function)或S形函数(Sigmoid Function)的函数来建模数据点属于正类别的概率。逻辑函数的数学表示如下:

P ( Y = 1 ∣ X ) = 1 1 + e − z P(Y=1|X) = \frac{1}{1 + e^{-z}} P(Y=1∣X)=1+ez1

其中, P ( Y = 1 ∣ X ) P(Y=1|X) P(Y=1∣X) 表示给定输入 X X X 条件下数据点属于正类别的概率, z z z 是输入特征的线性组合。这个概率值范围在0到1之间,它表示数据点属于正类别的可能性。

线性组合

在逻辑回归中,我们将输入特征的线性组合表示为 z z z

z = θ 0 + θ 1 X 1 + θ 2 X 2 + … + θ n X n z = \theta_0 + \theta_1X_1 + \theta_2X_2 + \ldots + \theta_nX_n z=θ0+θ1X1+θ2X2++θnXn

其中, θ i \theta_i θi 是模型的参数, X i X_i Xi 是输入特征。这个线性组合表示了数据点属于正类别的“原始分数”。

模型训练

逻辑回归的目标是找到最佳的参数 θ \theta θ,使模型能够最好地拟合训练数据并进行准确的分类。为了实现这一点,我们通常使用最大似然估计(Maximum Likelihood Estimation,简称MLE)来估计参数 θ \theta θ

MLE的目标是最大化在给定参数 θ \theta θ 下观察到训练数据的概率。通过最大化这个概率,我们使模型更可能产生观察到的训练数据,从而提高了模型的性能。

决策边界

一旦模型训练完成并找到最佳参数 θ \theta θ,我们就可以使用逻辑函数来进行分类。通常,我们会将概率值大于0.5的数据点分为正类别,概率值小于0.5的数据点分为负类别。这个概率阈值通常是可调的。

逻辑回归的决策边界是一个超平面,它将特征空间分成两个区域,每个区域对应一个类别。这个超平面的位置取决于参数 θ \theta θ

了解逻辑回归:从原理到实现

逻辑回归是一种常用于分类问题的机器学习算法。它具有简单的原理和实现,同时在各种应用中都有广泛的用途。在本篇博客中,我们将深入了解逻辑回归,包括其原理、实现和应用。

什么是逻辑回归?

逻辑回归是一种二分类算法,用于将输入数据分为两个类别,通常是正类别和负类别。尽管其名称中包含“回归”,但它实际上是一个分类算法,用于估计输入数据属于某一类别的概率。

逻辑回归的原理

逻辑回归的核心思想是使用S形函数(也称为逻辑函数)来建模输入特征和目标类别之间的关系。逻辑函数将输入映射到0到1之间的概率值,表示样本属于正类别的概率。其数学表示如下:

P ( Y = 1 ∣ X ) = 1 1 + e − z P(Y=1|X) = \frac{1}{1 + e^{-z}} P(Y=1∣X)=1+ez1

其中, P ( Y = 1 ∣ X ) P(Y=1|X) P(Y=1∣X) 表示给定输入 X X X 条件下样本属于正类别的概率, z z z 是线性组合的结果,通常表示为:

z = θ 0 + θ 1 X 1 + θ 2 X 2 + … + θ n X n z = \theta_0 + \theta_1X_1 + \theta_2X_2 + \ldots + \theta_nX_n z=θ0+θ1X1+θ2X2++θnXn

其中, θ i \theta_i θi 是模型的参数, X i X_i Xi 是输入特征。

逻辑回归的实现

逻辑回归的实现通常包括以下步骤:

  1. 收集和准备数据:收集样本数据,并对数据进行预处理和特征工程。

  2. 定义模型:选择逻辑回归作为模型,并初始化模型参数。

  3. 训练模型:使用训练数据集,通过最大似然估计等方法来估计模型参数。

  4. 预测和评估:使用训练好的模型对新数据进行预测,并评估模型性能。

  5. 超参数调优:根据性能指标调整模型的超参数,如学习率和正则化参数。

逻辑回归的应用

逻辑回归在许多领域都有广泛的应用,包括:

  • 医学:用于疾病诊断和预测患者风险。

  • 金融:用于信用评分和欺诈检测。

  • 自然语言处理:用于文本分类和情感分析。

  • 网络安全:用于入侵检测和威胁分析。

代码示例

以下是使用Python和Scikit-Learn库实现的简单逻辑回归代码示例:

from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score# 创建训练数据集和标签
X = [[1.2], [2.4], [3.1], [4.5], [5.0]]
y = [0, 0, 1, 1, 1]# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 创建逻辑回归模型
model = LogisticRegression()# 训练模型
model.fit(X_train, y_train)# 进行预测
y_pred = model.predict(X_test)# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print(f"准确率:{accuracy}")
# 损失函数
def compute_loss(y, y_pred):m = len(y)return -1 / m * np.sum(y * np.log(y_pred) + (1 - y) * np.log(1 - y_pred))# 梯度下降优化参数
def gradient_descent(X, y, theta, learning_rate, num_epochs):m = len(y)losses = []for epoch in range(num_epochs):z = np.dot(X, theta)y_pred = sigmoid(z)gradient = np.dot(X.T, (y_pred - y)) / mtheta -= learning_rate * gradientloss = compute_loss(y, y_pred)losses.append(loss)return theta, losses# 生成示例数据
np.random.seed(0)
X = np.random.randn(100, 3)
y = np.random.randint(0, 2, 100)
print(X)
print(y)
# 添加偏置项(截距项)到特征矩阵
X_b = np.c_[np.ones((100, 1)), X]# 初始化模型参数
theta = np.random.randn(4)# 定义梯度下降参数
learning_rate = 0.1
num_epochs = 1000# 使用梯度下降训练模型
theta, losses = gradient_descent(X_b, y, theta, learning_rate, num_epochs)# 打印最终参数和损失
print("最终参数:", theta)
print("最终损失:", losses[-1])

算法可视化

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score# 创建一个模拟的二分类数据集
X, y = make_classification(n_samples=100, n_features=2, n_classes=2, n_clusters_per_class=1, n_redundant=0, random_state=42)# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 初始化逻辑回归模型
model = LogisticRegression()# 训练模型
model.fit(X_train, y_train)# 预测测试集
y_pred = model.predict(X_test)# 计算模型的准确率
accuracy = accuracy_score(y_test, y_pred)
print("模型准确率:", accuracy)# 可视化训练集和测试集以及决策边界
plt.figure(figsize=(12, 5))# 绘制训练集
plt.subplot(1, 2, 1)
plt.scatter(X_train[:, 0], X_train[:, 1], c=y_train, cmap='coolwarm')
plt.title("训练集")# 绘制测试集以及决策边界
plt.subplot(1, 2, 2)
plt.scatter(X_test[:, 0], X_test[:, 1], c=y_test, cmap='coolwarm')
ax = plt.gca()
xlim = ax.get_xlim()
ylim = ax.get_ylim()
xx, yy = np.meshgrid(np.linspace(xlim[0], xlim[1], 50),np.linspace(ylim[0], ylim[1], 50))
Z = model.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)
plt.contourf(xx, yy, Z, cmap='coolwarm', alpha=0.6)
plt.title("测试集和决策边界")plt.show()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/131281.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

模板学堂|数据可视化仪表板大屏设计流程梳理

DataEase开源数据可视化分析平台于2022年6月正式发布模板市场(https://dataease.io/templates/)。模板市场旨在为DataEase用户提供专业、美观、拿来即用的仪表板模板,方便用户根据自身的业务需求和使用场景选择对应的仪表板模板&a…

Keil MDK-ARM 软件的部分常用快捷键如下

F7:编译。F8: 下载。F9:添加/取消断点。Ctrl F5:调试。Tab:将选中的内容整体右移。Shift Tab:将选中的内容整体左移。Home:将光标移至行首。End:将光标移至行末。Ctrl >:光标…

第1章_freeRTOS入门与工程实践之课程介绍

本教程基于韦东山百问网出的 DShanMCU-F103开发板 进行编写,需要的同学可以在这里获取: https://item.taobao.com/item.htm?id724601559592 配套资料获取:https://rtos.100ask.net/zh/freeRTOS/DShanMCU-F103 freeRTOS系列教程之freeRTOS入…

mysql5.8 免安装版(压缩包)win10 安装

目录 1、下载MySQL5.82、如何安装、配置my.ini配置注意 3初始化mysql3.1. 初始化mysql3.2. 安装mysql服务3.3. 启动mysql3.4. 登录mysql3.5. 修改root密码3.6. 配置远程连接 Mysql5.8安装踩坑记录,推荐使用Docker安装,我是电脑虚拟化可能会蓝屏没用这个功…

htaccess绕过上传实验

实验目的 利用上传htaccess文件解析漏洞绕过验证进行上传PHP脚本木马 实验工具 火狐:Mozilla Firefox,中文俗称“火狐”(正式缩写为Fx或fx,非正式缩写为FF),是一个自由及开放源代码网页浏览器&#xff0…

Python爬虫基础(一):urllib库的使用详解

文章目录 系列文章索引一、urllib库的使用1、基本介绍2、response的类型和关键方法3、下载文件4、GET请求实例(1)设置请求头(百度)(2)使用quote方法对get参数编码(百度)(…

【Redis】2、Redis持久化和性能管理

Redis 高可用 在web服务器中,高可用是指服务器可以正常访问的时间,衡量的标准是在多长时间内可以提供正常服务(99.9%、99.99%、99.999%等等)。 但是在Redis语境中,高可用的含义似乎要宽泛一些,除了保证提供…

每日一题 1462. 课程表 IV

难度:中等 思路: 显然它是一个课程图的结构,因为没有环也可以看成是森林结构对于一组 queries 最直接的方法就是以 v 作为根节点进行深搜或者广搜,能找到 u 就是 True,不能则是 False本体有多个 queries,…

【精华】AI Agent:大模型改变世界的“钥匙”

文章目录 1.Auto-GPT2.BabyAGI3.AgentGPT4.GodMode5.AI Town6.ChatDev 当前大模型的本质是大语言模型(Large Language Model, LLM)。相较于传统的自然语言处理模型,LLM通过无监督训练,从大量文本数据中学习自然语言的模式和结构&a…

9.13 | day 6 |day 45| to 完全平方数

● 70. 爬楼梯 &#xff08;进阶&#xff09; class Solution {public int climbStairs(int n) {int[] dp new int[n1];//设置背包容量&#xff1a;n个int m 2;//有两个物品&#xff0c;注意这是一个完全背包问题dp[0] 1;//initialize ​for(int i 1;i<n;i){//遍历背包f…

centos7使用docker-compose一键搭建mysql高可用主从集群

docker部署 环境准备 卸载旧版本 yum remove -y docker \docker-client \docker-client-latest \docker-common \docker-latest \docker-latest-logrotate \docker-logrotate \docker-selinux \docker-engine-selinux \docker-engine 安装依赖 yum install -y yum-utils \…

操作指南 | 如何参与Moonbeam投票委托

投票委托允许没有时间或者专业度一般的用户能够在治理中拥有话语权。该功能加强了决策流程&#xff0c;并且确保更大范围地代表社区利益。 通过Moonbeam委托平台&#xff0c;你需要 $GLMR 和一个相兼容的钱包。此教程使用MetaMask示范。 如何参与投票委托 前往http://delega…

无涯教程-JavaScript - XIRR函数

描述 XIRR函数返回的现金Stream量表的内部收益率不一定是周期性的。要计算一系列定期现金Stream量的内部收益率,请使用IRR函数。 语法 XIRR (values, dates, [guess])争论 Argument描述Required/OptionalValues 与日期付款时间表相对应的一系列现金Stream量。 请参阅下面的…

SpringCloud

微服务&#xff1a; 可以单独部署&#xff0c;单独运行&#xff08;启动类&#xff09; 狭义&#xff1a; 集群&#xff1a;相同模块&#xff08;系统&#xff09;部署多个微服务&#xff1a;可独立运行的小系统分布式&#xff1a;由不同模块构建而成的系统 广义&#xff1a…

【C语言】指针详解(3)

大家好&#xff0c;我是苏貝&#xff0c;本篇博客带大家了解指针(2)&#xff0c;如果你觉得我写的还不错的话&#xff0c;可以给我一个赞&#x1f44d;吗&#xff0c;感谢❤️ 目录 一.函数指针数组二.指向函数指针数组的指针&#xff08;不重要&#xff09;三.回调函数 一.函…

【C++进阶】:红黑树

红黑树 一.红黑树简单实现1.性质二.更新颜色1.情况一2.情况二3.情况三 3.完整代码(代码有注释&#xff0c;稍微画图很容易理解,旋转部分可以看我的AVL树博客) 二.map和set1.基本实现2.迭代器 一.红黑树简单实现 1.性质 红黑树&#xff0c;是一种二叉搜索树&#xff0c;但在每个…

中国各省市相关图标

中国各省市相关图标

长胜证券:政策东风频吹 慢牛格局或已打开

长胜证券认为&#xff0c;目前商场遭到央行社融数据提振&#xff0c;全体预期出现了必定的回暖&#xff0c;经济运行的部分不确定性得以落地&#xff0c;8月社融数据作为先行指标提振了出资者信心。操作上看出资者可逐步加大仓位&#xff0c;选择前期调整较为充沛&#xff0c;有…

代码随想录算法训练营day50|123.买卖股票的最佳时机III|188.买卖股票的最佳时机IV

123.买卖股票的最佳时机III 力扣题目链接 给定一个数组&#xff0c;它的第 i 个元素是一支给定的股票在第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你最多可以完成 两笔 交易。 注意&#xff1a;你不能同时参与多笔交易&#xff08;你必须在再次购买前出售掉…

网络爬虫-----初识爬虫

目录 1. 什么是爬虫&#xff1f; 1.1 初识网络爬虫 1.1.1 百度新闻案例说明 1.1.2 网站排名&#xff08;访问权重pv&#xff09; 2. 爬虫的领域&#xff08;为什么学习爬虫 ?&#xff09; 2.1 数据的来源 2.2 爬虫等于黑客吗&#xff1f; 2.3 大数据和爬虫又有啥关系&…