Deep convolutional neural network for the automated detection and diagnosis of seizure using EEG signals

ABSTRACT

脑电图(EEG)是一种常用的辅助测试，有助于癫痫的诊断。EEG信号包含关于大脑电活动的信息。传统上，神经学家采用直接视觉检查来识别癫痫样异常。这种技术可能是耗时的，受技术人工制品的限制，根据读者的专业水平提供可变的结果，并且在识别异常方面是有限的。因此，有必要开发一个计算机辅助诊断(CAD)系统，利用机器学习技术自动识别这些脑电信号的类别。这是首次采用卷积神经网络(CNN)分析脑电信号的研究。在这项工作中，一个13层深度卷积神经网络(CNN)算法被用来检测正常，发作前和发作类。所提出的技术分别实现了88.67%、90.00%和95.00%的准确性、特异性和敏感性。

INTRODUCTION

根据世界卫生组织(世卫组织)的统计，全世界有近5000万人患有癫痫[1]。据估计，每年有240万人被诊断患有癫痫[1]。癫痫发作是由于一组神经元中不受控制的放电造成的。[2, 3].

过度的放电会导致大脑功能的破坏。当至少两次无缘无故的癫痫发作复发时，诊断为癫痫。它可以影响任何年龄的任何人。为了启动抗癫痫药物治疗并随后降低未来癫痫发作和癫痫相关并发症的风险，对患者而言，及时准确的癫痫诊断至关重要[5]。目前，癫痫的诊断是通过获得详细的病史、进行神经学检查以及诸如神经成像和EEG的辅助测试来进行的。

EEG信号可以识别发作间(发作之间)和发作期间(发作期间)癫痫样异常。图1显示了健康受试者和癫痫患者大脑中的电活动的图示。通常，神经元通过电信号进行交流。

因此，在正常的大脑活动中，这些电信号是正常调节的[3](见图1中的正常活动)。然而，在癫痫发作期间，致痫神经网络的超同步电活动异常增加。这种活动可能局限于大脑的一部分，或者扩散到整个大脑。在这两种情况下，患者可能会出现临床癫痫发作(参见图1中的癫痫发作活动)[3]。神经病学家通过直接视觉检查仔细检查EEG，以调查癫痫样异常，这可以提供关于患者癫痫的类型和病因学的有价值的信息。然而，通过视觉评估解释EEG信号是非常耗时的，特别是随着门诊病人动态EEG和住院病人连续视频EEG记录的使用增加，需要手动审查几个小时或几天的EEG数据[6]。大多数EEG软件包括某种形式的自动癫痫发作检测，然而，由于预定癫痫发作检测算法的灵敏度和特异性较差，当前形式的自动癫痫发作检测很少用于临床实践。此外，视觉检查的固有性质导致基于EEG读取器在脑电图学方面的专业水平的不同临床解释。

使事情复杂化的是，研究的质量可能会被干扰的人为信号所混淆，限制了读者准确识别异常的能力。此外，常规门诊研究的低产量造成了另一个问题。癫痫患者可以去做门诊脑电图，研究可能完全正常。这是因为癫痫患者的大脑通常不会持续发出癫痫放电。脑电图只是记录时大脑的“快照”。识别癫痫放电的灵敏度可以通过让患者回来进行重复的门诊研究或通过家庭流动研究或住院连续视频EEG监测研究对其进行更长时间的记录来提高，这对于患者和阅读EEG的医生来说都是昂贵且费时的。由于几个不同的原因，病人被转到癫痫监视单元进行住院病人连续视频EEG监视。通常在癫痫的诊断不明确时进行，即患者的病史不典型于癫痫发作，或可能代表临床上类似于癫痫发作的另一种情况，即晕厥，或如果服用抗癫痫药物后癫痫发作频率没有改善。病人被送进医院，并连着几天接受脑电图检查。如果他们正在服用抗癫痫药物，就要停药。对他们来说，最重要的是当他们被连接到脑电图机器上时，他们会有癫痫或类似癫痫的事件。然后，训练有素的神经病学家或癫痫学家结合EEG的视觉检查来分析事件的临床特征，以确定患者是否患有癫痫。数据量的增加也允许癫痫学家寻找发作间异常。通常，在癫痫发作期间，脑电图活动变得非常异常，并且可以清楚地确定患者的事件是癫痫还是非癫痫。与正常EEG信号相比，癫痫EEG信号更加混乱并且变化更大。在癫痫发作期间，神经放电突然激增，导致EEG信号的差异增加。癫痫发作期间大脑半球的神经元不工作并产生异常的电活动。因此，癫痫发作期间可用于数据处理的神经元数量减少。然而，有时这可能非常困难，因为一些患有癫痫的患者，通常是患有额叶癫痫或源自深源或非常小的区域的癫痫发作的患者，可能具有临床癫痫发作，而发作EEG是正常的。尽管癫痫样异常总是存在，但这些异常不会记录在头皮表面电极上。因此，这使得诊断非常困难。在接受手术评估的顽固性癫痫患者中，使用侵入性颅内深度电极和/或网格来识别致痫区，这带来了围手术期风险和并发症。

图2显示了来自波恩大学数据库的正常、发作间期和癫痫发作EEG信号样本。这些信号的视觉解释容易出现观察者之间的差异。因此，为了准确、快速和客观的诊断，提倡使用计算机辅助诊断(CAD)系统。自从Adeli等人的开创性文章[7]以来，基于EEG的自动癫痫发作检测和癫痫诊断一直是重要研究的主题。许多研究人员提出了不同的方法来使用EEG信号自动检测癫痫发作。关于该文献的综述，参见Acharya等人[8]和Faust等人。讨论了不同的方法，即时间、频率、时间-频率和非线性方法。Acharya等人[10]还回顾了熵在基于脑电图的癫痫自动诊断中的应用。

因此，EEG信号本质上是非线性和非平稳的；信号非常复杂，很难直观地解释信号(见图2)。基于评论[810]，可以观察到研究人员已经提取了特征，执行了统计分析，对特征进行了排序，并且通过比较不同分类器的性能对最佳分类器进行了分类。因此，工作流程由许多标准步骤组成。这项工作提出了深度学习的实现，用于自动检测正常、发作前和发作EEG信号，而无需执行特征提取和选择。

深度学习是一种基于表示学习的机器学习技术，其中系统从多层输入数据的处理中自动学习和发现分类所需的特征[11]。深度学习已经证明了它的能力，并在音频和图像识别任务中超过了人类[11，12]。它已被用于许多其他复杂的机器学习应用，如阿尔茨海默氏病的早期诊断[13]，房地产单位销售价格的预测[14]，混凝土抗压强度的估计[15]。此外，许多大型技术公司，如苹果、百度、谷歌、IBM、脸书、微软和网飞，已经在其研究中接受并利用了深度学习[16、17、18]。本研究采用深度学习方法自动识别三类脑电信号。据作者所知，这是第一个采用深度学习算法对三种EEG类别进行自动分类的EEG研究。开发了一个13层深度卷积神经网络(CNN)来分类正常、发作前和发作类。

DATA

本研究中使用的脑电图片段是由德国波恩大学的Andrzejak等人[19]收集的(http://epilepsy . uni-freiburg . de/database)。这些片段是从连续多通道EEG记录中选择的，通过视觉检查消除了由于肌肉活动和眼球运动造成的伪影。从5名患者获得的数据集包含三类数据，即正常(B组)、发作前(D组)和发作(E组)。每个数据集中总共有100个EEG信号。每个记录是一个持续时间为23.6秒的单通道EEG信号。正常数据集包括从5个健康受试者获得的EEG信号，每个受试者包含100个病例。类似地，发作前类包含来自5名癫痫患者的100个数据，当他们在采集期间没有经历发作时。癫痫发作类别由100个在信号采集期间患有癫痫的相同受试者的病例组成。

METHODOLOGY

Pre-processing

在馈入一维深度卷积网络(CNN)进行训练和测试之前，每个EEG信号用Z分数归一化、零均值和标准偏差1进行归一化。EEG信号的采样率被设置为173.61 Hz。

Artificial Neural Network (ANN)

通常，人工神经网络有三层:输入层、隐藏层和输出层(见图3) [20]。人工神经网络的概念是受人脑中复杂网络结构的启发。人工神经网络由称为节点或神经元的连接单元的集合组成。就像大脑中发现的生物神经元一样，这些神经元整合输入信号，并将它们传输到其他连接的神经元。神经元的输出受到前一层神经元给出的加权和的影响。然而，人工神经网络模型易受移位和平移失真的影响，这可能会导致较差的分类精度[21]。

Convolutional Neural Network (CNN)卷积神经网络

一种改进的和最近开发的神经网络，称为卷积神经网络(CNN)被用于这项研究。改进的人工神经网络具有平移和平移不变性[21]。CNN中的卷积运算是深度学习的子集，其近年来引起了很多关注，并用于图像识别，例如分析x射线医学图像[22]、磁共振图像[23]、组织病理学图像[24]、眼底图像[25]和计算机断层摄影图像[26]。但是，很少有人利用生理信号对CNN进行研究。因此，在作者以前的工作[27，28，29，30]中，对ECG信号实施CNN，以研究CNN算法在信号分析中的有效性。

CNN被用于利用心动过速心电图的不同间隔自动检测心律失常使用2秒和5秒ECG段的准确率分别为92.5%和94.9%[28]。CNN最近被用于使用ECG信号自动诊断心肌梗塞[27]和冠状动脉疾病[29]。[30].与ANN类似，CNN模型的最终输出决定基于网络结构中前几层的权重和偏差。因此，对于每一层，分别用等式(1)和等式(2)更新模型的权重和偏差。

其中W、B、l、λ、x、n、m、t和C分别表示权重、偏差、层数、正则化参数、学习速率、训练样本总数、动量、更新步长和成本函数。

用于训练CNN模型的参数是(I)λ(正则化)，(ii)学习速率，和(iii)动量。这些参数可以根据数据集进行调整，以实现最佳性能[6]。λ是为了防止数据过度拟合。学习率是为了控制网络在训练过程中学习的速度，动量有助于数据的收敛。在这项工作中，参数λ、学习率、动量分别设置为0.7、1×10-3和0.3。这些参数是通过反复试验获得的。

据作者所知，这项研究是首次将CNN应用于脑电信号处理，特别是癫痫检测。CNN架构由三种不同类型的层组成:(1)卷积层，(2)池层，和(3)全连接层[17]。

(1)卷积层:它由滑过EEG信号的滤波器(内核)组成。核是要与输入EEG信号卷积的矩阵，步幅控制滤波器在输入信号上卷积的程度。该层使用等式(3)对输入EEG信号和内核执行卷积。卷积的输出也称为特征图。卷积运算如下:

其中x是信号，h是滤波器，N是x中的元素数，输出向量是y。下标表示向量的第n个元素。

(2)池层:这一层也称为下采样层。池化操作降低了卷积层输出神经元的维数，从而降低了计算强度并防止了过拟合。在这项工作中使用了最大池操作。最大池操作只选择每个特征图中的最大值，从而减少输出神经元的数量。

(3)全连接层:该层与前一层中的所有激活具有全连接。

在这项工作中使用了两种类型的激活函数:(1)校正线性激活单元和(2) softmax。

(1) Rectified linear activation unit 整流线性激活单元:

在每个卷积层之后，通常采用激活函数。激活函数是将一个输出映射到一组输入的操作。它们用于赋予网络结构非线性。整流器线性单元是深度学习的既定激活函数[17]。泄漏整流器线性单元[31] (LeakyRelu)在本工作中用作卷积层(1、3、5、7、9、11和12)的激活函数。LeakyRelu具有在网络结构中增加非线性和稀疏性的特性。因此对输入中的小变化如噪声具有鲁棒性。等式(4)显示了LeakyRelu函数。

2) Softmax:该函数计算k个输出类的概率分布。

因此，第13层使用softmax函数来预测输入EEG信号属于哪一类(正常、发作前或发作)。其中x是净输入。p的输出值介于0和1之间，它们的和等于1。

Architecture

表1是提议的CNN结构的细节总结。表1中的参数(内核大小)是通过反复试验得出的。图4显示了具有4，097个输入样本长度的CNN结构的图形表示，其中绿色、蓝色和红色分别表示内核大小、最大池和全连接层。这个提议的CNN架构包括五个卷积层、五个最大池层和三个全连接层(总共11层深度的CNN)。步幅设置为1和2，分别用于EEG信号的卷积和最大汇集操作。使用等式(3)将输入层(图4中的层0)与大小为6的核进行卷积，以产生层1。然后，将大小为2的最大池应用于每个要素地图(第2层)。

在最大池操作之后，神经元的数量从4092×4减少到2046×4。

再次，将第2层中的特征图与大小为5的核进行卷积，以产生第3层。大小为2的最大池操作应用于每个特征图(第4层)，将神经元的数量减少到1021×4。然后，来自层4的特征图与大小为4的核进行卷积，以产生层5。同样，大小为2的最大池用于将输出层中的神经元数量减少到509 x 10(第6层)。第6层中的特征图再次与核大小为4进行卷积，以产生下一层(第7层)。同样，大小为2的最大池应用于特征地图(第8层)。层8中的特征映射与大小为4的核进行卷积，以产生层9。同样，大小为2的最大池应用于第10层中的每个要素地图。最终，在层10中，神经元完全连接到层11中的50个神经元，并且层11完全连接到层12中的20个神经元。最后，第12层通过3个输出神经元(代表正常、发作前和发作类别)连接到最后一层(第13层)。

Training of CNN

在这项工作中，采用批量大小为3的传统反向传播(BP) [32]来训练CNN。BP是计算损失函数相对于权重的梯度的方法。BP在训练期间通过网络反向传递误差信号，以便将权重更新到网络。批次大小是用于以下目的的信号数量每次培训更新。在这项工作中，批量选择为3。

Testing of CNN model

在这项工作中总共进行了150个时期的训练。一个时期指的是完整训练集的一次迭代。在一个时期的每次迭代之后，我们的算法通过使用总训练数据集的30 %( 90 %)来验证模型，从而验证CNN模型。这是为了防止CNN模型在训练过程中过度拟合。图5显示了这项工作中使用的所有脑电图信号的分布。

k倍交叉验证

本研究采用了十重交叉验证[33]方法。首先，EEG信号被随机分成十等份。EEG信号的十分之九用于训练CNN，而剩余的十分之一用于测试系统的性能。通过移动测试和训练数据集，该策略被重复十次。论文中报道的准确性、敏感性和特异性值是从10次评估中获得的平均值。

RESULTS

使用MATLAB编程软件，在具有两个英特尔至强2.40 GHz (E5620)处理器和24 GB随机存取存储器(RAM)的工作站上实现了所提出的算法。完成一个训练周期通常需要12.8秒。

表2列出了所有十倍的混淆矩阵。观察到90%的正常EEG信号被正确分类为正常EEG信号。此外，分别有1%和9%的正常EEG信号被错误地分类为发作前和发作。此外，高达88%的EEG信号被正确地分类为发作前信号，而12%的EEG信号被错误地分类为正常(4%)和发作(8%)类。类似地，88%的EEG信号被正确地分类为癫痫发作类别，12%被错误地分类为正常(6%)和发作前(6%)类别。表3总结了建议模型的性能(特异性、敏感性和准确性)。

DISCUSSION

表4总结了从波恩大学数据库获得的正常、发作前和发作EEG信号的自动检测研究。Adeli等人[34]提出了一种小波-混沌方法来分析6秒EEG和EEG的不同子带(delta、theta、alpha、beta和gamma)，通过整合小波[35]、信号处理技术和非线性科学的混沌理论[36]来识别癫痫发作和癫痫。混沌理论被用作一种数学显微镜来收集由EEG信号呈现的脑电波。用关联维数和最大李亚普诺夫指数分别表示系统复杂性和系统混沌性来表征脑电信号的非线性性质。GhoshDastidar等人[37]介绍了一种用于癫痫诊断以及癫痫发作检测的混合波段小波-混沌-神经网络(NN)方法。他们发现了一个9参数混合波段特征空间，利用Levenberg-Marquardt反向传播神经网络产生了96.7%的准确性。Ghosh-Dastidar等人[38]提出了一种主成分分析增强分类器，用于将EEG信号稳健可靠地分类为发作、发作间期和健康类别。这项研究的分类准确率达到了99.3%。

在过去的二十年里，已经提出了基于脉冲编码的神经元，称为脉冲神经元，其结合了神经元放电的时间方面[39]。使用脉冲神经元，开发了新一代神经网络，称为脉冲神经网络(SNN) [40-42 ]。Ghosh-Dastidar和[43]提出了一种改进的SNN模型，用于癫痫和癫痫发作检测。他们报告的分类准确率为92.5%。Ghosh-Dastidar和Adeli [40]提出了一种多尖峰神经网络，其中信息从一个神经元到下一个神经元以多个尖峰的形式通过多个突触以及新的监督学习算法进行传输。将该模型和学习算法应用于三类脑电分类问题，分类器准确率在90.7%到94.8%之间。Acharya等人[44-50]开发了几种计算机辅助设计算法来表征正常、发作前和发作脑电图信号。他们采用离散小波变换(DWT) [48，50]，熵[46，49]，高阶累积量[49]，高阶谱(HOS) [46]，非线性[44，46，47]和小波包分解[48]特征提取技术从EEG信号中提取有用的信息。此外，据Acharya等人[46]报道，将熵、HOS和非线性特征输入模糊sugeno分类器实现了99.7%的准确度和100%的灵敏度和特异性。Chua等人[51]提取了高阶光谱(HOS)特征来区分三种不同的类别(正常、发作间期、发作)。他们采用高斯混合模型(GMM)分类器，并达到93.1%的准确率。在他们后来的研究中，他们通过将高阶统计量和熵特征与GMM分类器结合起来进行了改进。他们分别获得了93.1%、89.7%和94.8%的准确性、敏感性和特异性[52]。Faust等人[53]比较了三种不同的基于模型的谱密度估计方法的有效性，即YuleWalker、Burg和自回归移动平均技术对EEG信号的表征。他们报告说，伯格的方法与支持向量机(SVM)分类器[54]产生93.3%的准确性，98.3%和96.7%的灵敏度和特异性分别。

Guo等人[55]采用遗传编程从EEG信号中自动提取有用的特征。他们的方法可以自我学习并自动完成特征选择过程。他们报告了k-最近邻分类器的准确率为93.5%。张和周[56]讨论了使用SVM进行颅内脑电图癫痫发作检测的多重分形分析。Vahabi等人。

[57]使用电信号层析成像的基于小波的双相相关进行在线癫痫发作预测。Yuan等人[58]描述了使用基于对数欧几里德高斯核的稀疏表示的癫痫发作检测。Martis等人[59]提出了经验模式分解和希尔伯特变换方法的组合来检测三种EEG类别。他们达到了95.3%的准确率。

将EEG信号自动分类为正常、发作前和发作类别。提出了13层CNN，因为它提供了良好的收敛性和最高的性能精度。CNN结构的所有参数都被仔细微调，以便获得具有最佳收敛速度的模型。深度网络允许学习更复杂非线性函数，然而这种网络可能难以收敛。另一方面，浅层网络更容易训练，但提取的特征简单，可能不足以进行分类。尽管与表4中记录的出版作品相比，该提出的模型不能产生最佳的分类性能，但是该提出的CNN模型仍然设法获得了88.67%的准确度、95.00%的灵敏度和90.00%的特异性。这表明，在给定更多脑电数据的情况下，所提出的模型能够以最少的脑电数据预处理获得更好的结果。因此，使用所提出的模型的整体诊断性能可以随着更多数量的EEG数据而提高。