禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者!
文章目录
- 介绍
- LDA的原理
- LDA的步骤
- 教程
- 下载数据
- 加载R包
- 导入数据
- 数据预处理
- 数据描述
- 数据切割
- 构建模型
- 预测测试数据
- 评估模型
- 模型准确性
- 混淆矩阵
- 模型评估指标
- ROC Curve
- PRC Curve
- 保存模型
- 总结
- 优点:
- 缺点:
- 系统信息
介绍
线性判别分析(LDA)是一种监督学习的降维技术,同时也是一种分类算法。它旨在找到一个线性组合的特征,这些特征对于区分或分类不同的组或类别是最佳的。LDA假设每个类别的数据都是正态分布的,并且所有类别共享相同的协方差矩阵。
LDA的原理
- 类内散布矩阵(Within-Class Scatter Matrix):这是衡量每个类别内部数据点分散程度的矩阵。对于所有类别,这个矩阵是它们各自类内散布矩阵的和。
- 类间散布矩阵(Between-Class Scatter Matrix):这是衡量不同类别之间数据点分散程度的矩阵。它反映了类别均值与总体均值之间的差异。
- 判别函数:LDA通过最大化类间散布矩阵与类内散布矩阵的比率来找到最佳的投影方向,这个比率被称为判别函数。