支持向量机是典型的二分类模型,以其模型简单、实现简单、效果卓越而著称。
一元支持向量机
我们通过一条中间线根据特征对样本实现分类,很明显:两个支持样本的差别越大,两个支持样本的分类效果就越好。
二元支持向量机
在实际生活中,我们很少会仅依靠单一维度的特征对样本进行分类,考虑了一元支持向量机,我们再来看看二元支持向量机,在二元支持向量机模型当中,核心思想就是要找出一条直线恰好能够尽可能完美地分割两类样本点,从图形上理解:在两类样本点之间作矩形,在找出最大矩形之后在其中央画出分割线,就是我们要找到最佳方案
二元分类直线的函数形式:
设最佳样本分类直线:Ax+By+C=0
与正样本最边缘相交的直线:Ax+By+E=0
与负样本最边缘相交的直线:Ax+By+F=0
由于最佳直线是两条边缘直线的中线,因此:
C=(E+F)/2
令t=(E-F)/2,有:
将三式同时除以t:
并且设a=A/t,b=B/t,c=C/t
因而,对于所有正样本,ax+by+c>=+1;对于所有负样本,ax+by+c<=-1
当两条直线距离最大时就是我们要求的最优解
并且求解最大该间隔的公式就是2024年数学高考圆锥曲线的主要考——求解两直线之间的距离:
为了更好的求解,设w=
我们进一步对原问题转化:
约束条件就是几个点相对于最优/最劣直线的位置
然后使用拉格朗日乘子法,并令其满足KKT条件:
- 拉格朗日函数对变量求导为零(极值的必要条件)
- 所有乘子大于或小于0(拉格朗日的乘子约束)
- 乘子和约束至少一个为0(互补松弛条件)
然后像是三元四元解法一样,
继续用拉格朗日乘子法就好。
到前面已经能够通过寻找最优超平面来实现支持向量机模型了,但是这个工作量非常大,因此算法还有改进的空间
应用:
齿轮箱是用于增加输出扭矩或改变电机速度的机械装置,被广泛应用于如汽
车、输送机、风机等机械设备中。它由两个或多个齿轮组成,其中一个齿轮由电
机驱动。电机的轴连接到齿轮箱的一端,并通过齿轮箱的齿轮内部构件,提供由
齿轮比确定的输出扭矩和速度。典型的齿轮箱剖面如图 1 所示。在齿轮箱的运行
过程中,可以通过加装加速度传感器采集振动信号来判断齿轮箱是否出现异常。
本题旨在通过建立相关数学模型对齿轮箱采集到的振动信号进行分析。
图 1. 典型的齿轮箱结构
在本题中,我们通过安装在齿轮箱不同部位的四个加速度传感器,采集了 5
种状态下齿轮箱的振动信号,具体数据见附件 1。其中表单 gearbox00 为齿轮箱
正常工况下采集到的振动信号;表单 gearbox10 为故障状态 1 下采集到的振动信
号;表单 gearbox20 为故障状态 2 下采集到的故障信号;表单 gearbox30 为故障
状态 3 下采集到的故障信号;表单 gearbox40 为故障状态 4 下采集到的振动信号。
信号的采样频率为 6.4kHz。请利用这些数据,建立数学模型解决以下问题:
建立齿轮箱的故障检测模型,对其是否处于故障状态进行检测,并对模
型的性能进行评价。