Neural Network Based Epileptic EEG
Detection and Classification
ABSTRACT
及时诊断对挽救癫痫患者的生命至关重要。在过去的几年里,有很多治疗癫痫的方法。这些治疗需要使用抗癫痫药物,但对控制癫痫发作频率无效。需要通过手术切除受影响的区域。
脑电图(EEG)是一种广泛应用于监测大脑活动的技术,在癫痫区域检测中得到广泛应用。它用于术前定位受影响的区域。这种使用脑电图图的手工过程非常耗时,而且需要深入的专业知识。本文提出了一种以文本一维向量形式保留脑电信号真实性质的模型。提出的模型达到了波恩大学数据集的最佳性能,在所有五类脑电图数据分类中,平均灵敏度、特异性分别为81%和81.4%。此外,二元分类的特异性和敏感性评分值分别为99.9%和99.5%,而不是其他研究人员使用的二维模型。因此,该系统的开发将大大有助于神经外科医生的工作表现的提高。
1. Introduction
癫痫是一种主要发生在生命初期的疾病。这是一种神经系统疾病,在全世界都很常见。这是一种长期的疾病。这种疾病不会通过直接的身体接触传播。癫痫的主要特征是发作。癫痫发作是小腿和手臂等身体部位的短时间反射性颤抖(Abbasi等人,2019年)。随着最近技术领域的发展,出现了许多新的治疗方法。这些治疗包括使用抗癫痫药片。但这些在控制癫痫发作频率方面并不有效(Abedin等人,2019年9月)。因此,唯一可用的治疗方法是通过手术切除受影响的大脑部分。脑电图由从大脑接收信号的电极组成。这些波有助于定位大脑中受癫痫影响的区域。在大多数情况下,人工检查低质量的脑电图图(Acharya等人,2018年)。这需要大量的前期专业知识。目前还没有一种跨国家记录脑电图的标准化方法。这减少了国际专家的建议(Bhagat等人,2019年)。这一切都增加了神经外科医生的压力,使手术变得繁琐。因此,需要利用人工智能对癫痫数据进行自动化分类。这将有助于将脑电图信号划分为具有医学意义的类别。
在目前的研究中,已经提出了一个模型,该模型实现了波恩大学数据集的最新性能。对五类脑电数据进行分类,其平均灵敏度和特异度分别为81%和81.4%。此外,对于二分类,模型的特异度和敏感度分别达到了99.9%和99.5%的分值,优于其他研究人员。此外,在开发它们所使用的二维(2D)模型时,原始文本数据的真实性质也会丢失。因此,它将有助于神经外科医生,并将有助于通过开发基于物联网(IoT)的预测和诊断设备来轻松定位大脑受影响的部分。
2. Literature Review .文献综述
Lian等人报道,当向卷积神经网络(CNN)输入一对EEG信号以形成二维(2D)矩阵时,平均灵敏度和特异性分别为99.5%和99.6% (Lian等人,2020年2月)。2019年,Choi等人提出了具有深度神经网络(DNN)模型的多尺度3D CNN,其灵敏度和特异性分别达到97%和99.3% (Choi等人,2019)。Huang等人提出了一种基于注意力的CNN-BiRNN(双向循环神经网络)对健康和不健康患者进行分类。其平均敏感度和特异性分别为93.94%和92.88% (Huang et al., 2019)。Wei等人在2019年提出了12层CNN,对原始数据进行分类,所有5类的敏感性和特异性分别为70.68%和92.36% (Wei等人,2019)。刘等人提出了一个2D CNN,五个类别的准确率为64.5% (Liu等人,2020年1月),提出的CNN在脑电信号的同时输入多种生物信号。Thanaraj等人报道,使用CNN进行二元分类的准确率为92%。利用葛兰姆角和场(GASF)将脑电图信号转换为RGB图像输入CNN。开发的CNN由预先训练的标准架构组成,即AlexNet、VGG16和VGG19 (Thanaraj等人,2020年3月)。
从文献综述中发现,大部分工作是通过将原始文本数据转换为二维形式进行的。它要么通过配对脑电图矢量,要么通过将文本数据转换为图像和光谱仪来实现。这种向2D形式的转换破坏了原始文本数据的真实性质。这将导致性能下降。此外,大多数工作是围绕二元分类进行的,与所有五类分类相比,二元分类的特征提取更容易。
2.1. Dataset
癫痫发作识别数据集取自UCI机器学习库。数据集由波恩大学癫痫学系准备(Andrzejak et al., 2001)。它是免费开放的,可以用于研究工作。它包含原始文本脑电图信号数据。数据记录时间为23.6秒(Yeola等人,2019年)。它包括11500个长度为178的样本和1列标签类。所有类的描述以表格形式列示在表1中。
3. Research Methodologies 研究方法
本研究提出将癫痫的完整诊断过程分为两个工作,在模型的训练中逐步改进。它是基于表1所示的数据集分类,对癫痫影响的大脑皮层区域的定位和治疗具有重要意义。
3.1. Training Methodology训练方法
该模型被训练为两个不同的工作,分别是:-工作1:对健康人(AB)和癫痫发作时的人(E)进行分类。
工作2:对所有五种状态进行分类,即健康(开放)、健康(关闭)、发病期间、发病前和发病期间。
3.2. Proposed Model模型
使用python中的pytorch库实现了所提出的模型。总数据集11500的76%用于训练目的。验证和测试分别使用了12%和12%的遗漏数据集。
总共20个历元用于训练模型。一个历元指的是整个数据集的完整遍历。
具有最小损失的模型被保存用于将来的测试。模型的丢失有助于评估模型在每次优化迭代后的表现。用于评估模型的损失函数是交叉熵。该模型主要包括两个模块,即基本块和提出的模型块。两个模块的数据流图如图1和图2所示。在基本块中使用了跳跃连接来克服梯度消失,如图1所示。
基本块的数据流图
提及模块的数据流图。
在图2中,神经元的数量用N表示,图1所示的各种顺序基本块用于不同数量的神经元。
在二元分类中,即job1,交叉熵使用公式计算:
在多类分类中,即job2,对每类损失进行计算,并对结果进行汇总:
M:类别数
log:自然对数
p:类别c的预测概率
y:二进制指示符(0或1) 是否标签c是正确的观察值
3.3. Algorithms算法
图3和图4分别显示了基本块和提议模型的算法的图形表示。所提出的模型的算法有助于特征提取。它还有助于预测输入EEG向量的标签。它调用内部的基本块算法来完成该过程
I .具有输入向量V和神经元数量N的基本块的算法
二。具有输入EEG信号向量E和类别数量C的模型的算法
4. Results and Discussion
在所提出的模型中,执行20个时期,并且将最佳模型保存在外部文件中,用于将来的测试和诊断。用于评估最佳拟合模型的除损失函数“交叉熵”之外的指标如下:
特异性(精确度):有助于评估模型预测每类真阴性的能力。已使用公式对建议模型进行了评估。
灵敏度(召回率):有助于评估模型预测每一类真阳性的能力。已使用公式对建议模型进行了评估:
F1分数:有助于传达精确度和召回率之间的平衡。它是使用两者之间的谐波通过下面所示的公式计算的:
4.1. Proposed Model Execution提议的模型执行
工作1:对健康人(AB)和癫痫发作期间的人(E)进行分类。
在针对作业1的建议模型的训练会话期间,在第9时段期间找到最佳拟合模型。图5 (a)显示了针对作业1执行时,建议模型的培训和验证损失趋势。图5 (b)中还显示了作业1中所有类别的分类报告。该报告包含每个类别的特异性(精确度)、敏感性(召回率)和F1分数的值。工作1的平均灵敏度、特异性得分分别为0.99和0.995。最佳拟合模型的训练损失和验证损失以表格形式显示在表2中。
工作2:在所有五种状态之间进行分类,即健康(开放)、健康(封闭)、发作间期、发作前和发作
在针对作业2的提及模型的训练期间,在第14个时期期间找到最佳拟合模型。图6 (a)显示了针对作业2执行时,建议模型的培训和验证损失趋势。图6 (b)中还显示了作业2中所有类别的分类报告。该报告包含每个类别的特异性(精确度)、敏感性(回忆)和F1分数的值。工作1的平均灵敏度、特异性分数分别为0.814和0.81。最佳拟合模型的训练损失和验证损失以表格形式显示在表2中。
4.2. Comparative analysis with Existing Architectures 与现有架构的比较分析
表2比较了建议模型与现有标准模型的训练损失和验证测试损失。现有的标准模型也在同一个数据集上执行,以便对所有作业(即工单1和工单2。可以观察到,所提出的模型比被超调以在相同数据集上工作的标准模型工作得更好(具有最小损失值)。
4.3. Comparative analysis with Existing Methods与现有方法的比较分析
表3比较了每项工作所有类别的平均特异性和敏感性。可以观察到,与现有方法相比,所提出的模型具有更好的精确度(特异性)和灵敏度(召回率)。与Wei等人的工作2相比,所提出的模型在特异性和敏感性之间具有更好的平衡。因此,所提出的模型实现了最先进的性能。
5. Conclusion
在所提出的模型中,使用了一维卷积神经网络(CNN ),其通过在基本块中使用跳跃连接克服了消失梯度的问题,并且还保护了输入数据(文本)的真实性质。与现有的工作相比,将数据转换成二维矩阵形式或者将数据转换成图像和图形。
从表2中可以得出结论,建议的模型优于现有的标准模型(大约。损失少50%)。通过平衡的F1分数,所提出的模型在敏感性和特异性之间具有良好的平衡。由于在将EEG数据分类为所有五类时特征提取困难,大部分工作是针对二分类进行的。但是所提出的模型对于所有五个类别的分类以及二元分类表现得更好。从表3中可以清楚地看出,对于取自波恩大学的数据集,所提出的模型达到了最先进的性能,对于所有五个类别中的分类,给出了分别为81%和81.4%的平均灵敏度、特异性。此外,二元分类实现了99.9%、99.5%的特异性和敏感性分值。因此,目前的研究是重要的,将脑电图数据分类为所有五类。这五个类别对于进一步开发基于物联网(IoT)的预测和诊断设备在医学领域具有重要意义。