使用无监督机器学习算法进行预测性维护

目录

一、说明

二、主成分分析(PCA)

三、 K-means方法

四、K-最近邻 (KNN)

五、密度的空间聚类 (DBSCAN)

六、更先进的预测性维护算法

6.1 独立成分分析 (ICA)

6.2 PCA 和 ICA 有什么区别?

6.3 OPTICS 聚类

6.4 自组织映射 (SOM) 

6.5 局部敏感哈希 (LSH)近似


一、说明

        作者在发电行业研究数据科学几年后,意识到最有效的预测性维护工具是无监督的机器学习算法。本篇从若干机器学习方法种,提取非监督学习算法的种种优缺点,展开进行分析。

二、主成分分析(PCA)

        让我们从最古老和最基本的算法之一主成分分析(PCA)开始。卡尔·皮尔逊于 1901 年开发了PCA 。你可以在这里找到它。主成分分析擅长降维,从而降低模型复杂性维数灾难),消除多重共线性过度拟合。此外,PCA还可用于可视化和识别趋势、模式或异常值。

        PCA可以减少没有标签的维度。因子分析特征提取也是 可能的。PCA创建新变量,例如主成分,它们是原始变量的线性组合。PCA采用高维数据并在具有较少变量的较低子空间中生成数据集。PCA一种用于数据分析的无监督机器学习技术。PCA 中有一些关键词需要学习例如特征值特征向量协方差。我愿意在单独的 Medium 文章中解释PCA 的细节。

        还有另一种基本的无监督学习技术,即K 均值聚类。PCA用于降低数据的维数,而K 均值聚类则根据相似性将数据点分组。它们有不同的目标和方法

主成分分析(PCA)

三、 K-means方法

        K-means是一种基于质心的迭代聚类算法。质心或聚类中心是聚类内所有点的平均值或中位数,具体取决于数据的特征。第一步是初始化 k 个质心,其中k等于为特定数据集选择的聚类数。k-means 算法的关键词是Elbow 方法聚类内平方和 (WCSS)

 K 均值

K-means的优点是简单,快速,可扩展。

K-means 的缺点是依赖于输入参数、在某些数据集上可能表现不佳、异常值影响显著。

我愿意在单独的 Medium 文章中解释k-means 的细节。

肘部方法

四、K-最近邻 (KNN)

        这里我必须提一下K-最近邻 (KNN)算法。这是预测性维护最重要的算法之一,也是当今机器学习中最流行、最简单的分类和回归分类器之一。在这种情况下,KNN算法中的k值定义将检查多少个邻居来确定特定查询点的分类。如果 k=1,则实例将分配到与其单个最近邻相同的类。回归问题使用与分类问题类似的概念,但在这种情况下,取 k 个最近邻的平均值来对分类进行预测。KNN 的关键词多数投票欧几里得距离曼哈顿距离闵可夫斯基距离汉明距离

        KNN的优点是易于实现,易于适应,超参数少。

        KNN 的缺点是扩展性不佳、维数灾难、容易过度拟合。

        注意:尽管KNN是一种监督学习方法,但我们必须提到,其余算法如 DBSCAN、OPTICS、SOM、LSH 算法在聚类过程后使用最近邻方法进行预测。

 KNN工作方法

五、密度的空间聚类 (DBSCAN)

        最后一种基本的无监督机器学习算法是基于密度的空间聚类 (DBSCAN)。它将聚类定义为数据集中有许多彼此接近的点的区域,而远离任何聚类的点则被视为异常值或噪声。我们的目标是将这些点聚类为密集在一起的组。

圆的半径ε(epsilon)是第一个参数。

圆的半径ε(epsilon)是第一个参数,最小点数m是另一个参数。

DBSCAN的关键词是核心点非核心点、边界点异常值

DBSCAN 聚类

DBSCAN是一个有用的数据清理和异常值检测工具。

DBSCAN的优点是通用性强,对噪声具有鲁棒性,并且最佳聚类数未知。

DBSCAN 的缺点是对超参数的选择比较敏感,在聚类密度差异较大的数据集上表现较差。

六、更先进的预测性维护算法

6.1 独立成分分析 (ICA)

4独立成分分析 (ICA)是一种统计和计算技术,用于机器学习,将多变量信号分离为独立的非高斯成分。ICA 的关键词是统计独立的高斯分布

鸡尾酒会问题

ICA的优点是它是分离混合​​信号的强大工具、非参数方法、无监督学习技术,并且有利于特征提取。

ICA 的缺点是非高斯、非线性混合、计算成本高、存在收敛问题。

6.2 PCA 和 ICA 有什么区别?

        PCA强调捕获最大方差并提供不相关的成分,而ICA侧重于提取统计上独立的成分,即使它们是相关的,因此ICA适用于盲源分离和信号提取任务。

我愿意在单独的 Medium 文章中解释ICA 的细节。

独立成分分析(ICA)

        另一种高级算法是按点排序以识别聚类结构 (OPTICS)。它在DBSCAN聚类的概念中又增加了两个术语。它与DBSCAN类似,但它可以提取不同密度和形状的聚类。它对于识别大型高维数据集中不同密度的聚类很有用。OPTICS 算法的关键词是Epsilonk-最近邻核心距离、可达距离可达图。

6.3 OPTICS 聚类

        OPTICS聚类技术需要的内存比DBSCAN要多,但参数要少。与DBSCAN相比OPTICS可以更有效地识别不同大小和形状的聚类。DBSCAN明确区分核心点、边界点和噪声点,而OPTICS不会明确识别噪声点。OPTICS 的运行时复杂度通常高于DBSCAN

        我愿意在单独的 Medium 文章中解释OPTICS 的细节。

可达性图

6.4 自组织映射 (SOM) 

        自组织映射 (SOM) — Kohonen映射是一种人工神经网络,其灵感也来自 20 世纪 70 年代的神经系统生物模型。SOM用于聚类和映射(或降维)。SOM有两层,一层是输入层,另一层是输出层。

        关键词是欧几里得距离、C聚类数、权重、 SOM算法中的学习率α。

 

som自组织

6.5 局部敏感哈希 (LSH)近似

局部敏感哈希 (LSH)近似高维数据点之间的相似性,使其成为高效解决最近邻搜索问题的理想选择。LSH与传统哈希方法的不同之处在于,它旨在最大化相似项之间的碰撞,而不是最小化它们。LSH 的关键词哈希函数最近邻碰撞

我愿意在单独的 Medium 文章中解释LSH的细节。

LSH

        这些算法可以检测异常,还可以检测哪些特征导致更多偏差。无监督和半监督学习方法为我们提供了非常强大的工具,可以尽快通知故障。

机器故障流程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/483093.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Elasticsearch 进阶

核心概念 索引(Index) 一个索引就是一个拥有几分相似特征的文档的集合。比如说,你可以有一个客户数据的索引,另一个产品目录的索引,还有一个订单数据的索引。一个索引由一个名字来标识(必须全部是小写字母),并且当我们要对这个索…

107.【C语言】数据结构之二叉树求总节点和第K层节点的个数

目录 1.求二叉树总的节点的个数 1.容易想到的方法 代码 缺陷 思考:能否在TreeSize函数内定义静态变量解决size的问题呢? 其他写法 运行结果 2.最好的方法:分而治之 代码 运行结果 2.求二叉树第K层节点的个数 错误代码 运行结果 修正 运行结果 其他写法 1.求二…

vue2 虚拟DOM 和 真实DOM (概念、作用、Diff 算法)

虚拟 DOM 和 真实DOM&#xff08;概念、作用、Diff 算法&#xff09; 1.1 概念 真实 DOM&#xff08;Document Object Model&#xff09;&#xff1a;是浏览器中用于表示文档结构的树形结构。 <h2>你好</h2>虚拟DOM&#xff1a;用 JavaScript 对象来模拟真实 DOM…

Spring AI 框架介绍

Spring AI是一个面向人工智能工程的应用框架。它的目标是将Spring生态系统的设计原则&#xff08;如可移植性和模块化设计&#xff09;应用于AI领域&#xff0c;并推广使用pojo作为AI领域应用的构建模块。 概述 Spring AI 现在(2024/12)已经支持语言&#xff0c;图像&#xf…

matlab 中的 bug

在matlab中绘图&#xff0c;设置 axe 的背景颜色 axes_in3.Color #00235B ;打印的时候 print(figure_handle1,-dpng,-r300,"merge_yt_ey") ;此时保存的图片无法识别背景颜色 原因在于 matlab 中的 InverseHardcopy 将 InvertHardcopy 设置成 off 则可以解决这个问…

【数据库系列】Liquibase 与 Flyway 的详细对比

在现代软件开发中&#xff0c;数据库版本控制是一个至关重要的环节。为了解决数据库迁移和变更管理的问题&#xff0c;开发者们通常会使用工具&#xff0c;如 Liquibase 和 Flyway。本文将对这两个流行的数据库迁移工具进行详细比较&#xff0c;从基础概念、原理、优缺点到使用…

DVWA靶场通关——DOM型XSS漏洞

一、DOM型XSS攻击概述 DOM型XSS&#xff08;DOM-based Cross-Site Scripting&#xff0c;DOM XSS&#xff09;是一种跨站脚本攻击&#xff08;XSS&#xff09;的变种&#xff0c;它与传统的反射型XSS&#xff08;Reflected XSS&#xff09;或存储型XSS&#xff08;Stored XSS&a…

flink学习(14)—— 双流join

概述 Join:内连接 CoGroup&#xff1a;内连接&#xff0c;左连接&#xff0c;右连接 Interval Join&#xff1a;点对面 Join 1、Join 将有相同 Key 并且位于同一窗口中的两条流的元素进行关联。 2、Join 可以支持处理时间&#xff08;processing time&#xff09;和事件时…

设计模式——Facade(门面)设计模式

摘要 本文介绍了外观设计模式&#xff0c;这是一种通过简单接口封装复杂系统的设计模式。它简化了客户端与子系统之间的交互&#xff0c;降低了耦合度&#xff0c;并提供了统一的调用接口。文章还探讨了该模式的优缺点&#xff0c;并提供了类图实现和使用场景。 1. 外观设计模…

泷羽sec-burp功能介绍(1) 学习笔记

声明&#xff01; 学习视频来自B站up主 **泷羽sec** 有兴趣的师傅可以关注一下&#xff0c;如涉及侵权马上删除文章&#xff0c;笔记只是方便各位师傅的学习和探讨&#xff0c;文章所提到的网站以及内容&#xff0c;只做学习交流&#xff0c;其他均与本人以及泷羽sec团队无关&a…

技术创新与人才培养并重 软通动力子公司鸿湖万联亮相OpenHarmony人才生态大会

11月27日&#xff0c;由开放原子开源基金会指导&#xff0c;OpenHarmony项目群工作委员会主办的OpenHarmony人才生态大会2024在武汉隆重举办。软通动力子公司鸿湖万联作为OpenHarmony项目群A类捐赠人应邀出席。大会期间&#xff0c;鸿湖万联不仅深度参与了OpenHarmony人才生态年…

简单快速的上手python

前言 python是一门可以快速上手的语言&#xff0c;原因是它语法简单&#xff0c;api容易使用自由灵活 当我们需要安装任何的三方库时&#xff0c;只需要执行 pip install XX 之后在代码里面import xxx就可以使用python啦。 并且python的代码自由灵活&#xff0c;使用缩进区…

【算法刷题指南】优先级队列

&#x1f308;个人主页&#xff1a; 南桥几晴秋 &#x1f308;C专栏&#xff1a; 南桥谈C &#x1f308;C语言专栏&#xff1a; C语言学习系列 &#x1f308;Linux学习专栏&#xff1a; 南桥谈Linux &#x1f308;数据结构学习专栏&#xff1a; 数据结构杂谈 &#x1f308;数据…

[241129] Docker Desktop 4.36 发布:企业级管理功能、WSL 2 增强 | Smile v4.0.0 发布

目录 Docker Desktop 4.36 发布&#xff1a;企业级管理功能、WSL 2 和 ECI 增强Smile v4.0.0 发布&#xff01;Java 机器学习库迎来重大升级 Docker Desktop 4.36 发布&#xff1a;企业级管理功能、WSL 2 和 ECI 增强 Docker Desktop 4.36 带来了强大的更新&#xff0c;简化了…

vue3+typescript自定义input组件

官方文档&#xff1a;https://cn.vuejs.org/guide/components/events#%E5%AE%9A%E4%B9%89%E8%87%AA%E5%AE%9A%E4%B9%89%E4%BA%8B%E4%BB%B6 触发与监听事件​ 在组件的模板表达式中&#xff0c;可以直接使用 $emit 方法触发自定义事件 (例如&#xff1a;在 v-on 的处理函数中)…

HarmonyOS4+NEXT星河版入门与项目实战(23)------实现手机游戏摇杆功能

文章目录 1、案例效果2、案例实现1、代码实现2、代码解释4、总结1、案例效果 2、案例实现 1、代码实现 代码如下(示例): import router from @ohos.router import {ResizeDirection } from @ohos.UiTest import curves

Qt的定时器应用案例 || Qt的图片添加显示

目录 1.ui界面 2.头文件 3.cpp源文件 4.main文件 5.关于ui_mytimerevent.h的代码编译错误 6.图片的添加展示方式 7.结果展示 8.参考文章 1.ui界面 2.头文件 #ifndef MYTIMEREVENT_H #define MYTIMEREVENT_H#include <QMainWindow> #include <QTime> //#in…

【大数据学习 | Spark-SQL】关于RDD、DataFrame、Dataset对象

1. 概念&#xff1a; RDD&#xff1a; 弹性分布式数据集&#xff1b; DataFrame&#xff1a; DataFrame是一种以RDD为基础的分布式数据集&#xff0c;类似于传统数据库中的二维表格。带有schema元信息&#xff0c;即DataFrame所表示的二维表数据集的每一列都带有名称和类型…

分布式集群下如何做到唯一序列号

优质博文&#xff1a;IT-BLOG-CN 分布式架构下&#xff0c;生成唯一序列号是设计系统常常会遇到的一个问题。例如&#xff0c;数据库使用分库分表的时候&#xff0c;当分成若干个sharding表后&#xff0c;如何能够快速拿到一个唯一序列号&#xff0c;是经常遇到的问题。实现思…

53 基于单片机的8路抢答器加记分

目录 一、主要功能 二、硬件资源 三、程序编程 四、实现现象 一、主要功能 首先有三个按键 分别为开始 暂停 复位&#xff0c;然后八个选手按键&#xff0c;开机显示四条杠&#xff0c;然后按一号选手按键&#xff0c;数码管显示&#xff13;&#xff10;&#xff0c;这…