随着健康意识的增强,人们越来越关注睡眠质量。确保获得充足的高质量睡眠对于维持身体健康和心理平衡至关重要。专业的睡眠状态测量主要通过多导睡眠图(PSG)进行。然而,PSG会给受试者带来显著的身体负担,并且在没有专业设施或医院的情况下很难进行测量。近年来,为了便于睡眠评估,开发了使用可穿戴设备的评估方法。但是,通过智能手表所能获得的信息是有限的,通常包括加速度和心率等数据。虽然基于脑电图(EEG)的睡眠监测提供高准确度,但需要佩戴头戴设备,即使是单通道EEG耳机,也带来了显著的负担。
与EEG或压力传感器不同,基于声音的方法是非接触式的,并且容易收集。睡眠声音指的是睡眠期间与生物活动相关的声音,例如打鼾、身体移动、咳嗽以及环境噪音。使用睡眠声音的方法比传统方法有优势,例如非接触式,并且能够检测许多生物活动。传统上,基于睡眠声音的睡眠评估主要集中于睡眠呼吸暂停综合征的检测,而关于睡眠质量评估的研究仍然有限。在现有的基于深度学习的使用睡眠声音的睡眠质量估计中,评估的基础是一个黑箱。
因此,我们提出一个基于机器学习使用睡眠声音的睡眠质量分类模型,该模型能够提供理由,例如“由于睡眠期间频繁翻身导致睡眠质量差”。通过提供理由,可能有助于提高用户的睡眠质量。
1 方法
通过聚类睡眠声音事件,提出了一种高度准确和可解释的睡眠质量分类方法。聚类睡眠声音事件有助于解释每个事件,从而能够识别对睡眠质量分类重要的事件。通过聚类睡眠声音事件,可以更容易地为每个事件赋予意义,从而识别对睡眠质量分类至关重要的事件。
- 睡眠声音事件提取: 从整夜连续录制的音频中提取睡眠声音事件,例如打鼾、身体动作、咳嗽等。我们采用Kleinberg的突发提取方法来提取睡眠声音事件。突发提取方法基于这样一个假设:波形的幅度遵循正态分布。它识别出那些被估计为由具有较大方差的正态分布持续生成的段落,与静止噪声相比。
- 频域转换: 使用快速傅里叶变换 (FFT) 将提取的声音事件转换到频域,并计算功率谱作为变分自编码器(VAE)的输入向量。
- 潜在表示提取: 使用变分自编码器 (VAE) 对功率谱进行学习,得到每个事件的潜在表示。我们对功率谱进行了归一化,使其总和等于一,将其视为概率分布,并使用Kullback-Leibler散度(KLD)作为VAE中的重建误差项。
- 事件聚类: 使用高斯混合模型 (GMM) 对潜在表示进行聚类,将每个事件分配到不同的类别中,并计算每个事件属于每个类别的概率。
- 数据增强: 通过对事件序列进行多次随机采样,生成不同的事件序列,模拟增加天数,从而扩充训练数据集。
- 睡眠满意度分类: 使用长短期记忆网络 (LSTM) 对经过数据增强的事件序列进行训练,预测睡眠满意度。要估计的主观评估是“满意度”,这是一个在“满意”和“不满意”之间的二元分类,不包括“中性”。
- 时间SHAP解释: 使用时间SHAP方法分析LSTM模型,解释睡眠质量分类中重要的事件类型和时间特征,例如身体动作、呼吸声、噪声等。
2 实验
2.1 数据集
- 研究使用了来自不同年龄段的参与者在家录制的睡眠声音数据,持续一个月。
- 使用智能手机 (Zenfone Live Android 7.0) 进行录音。
- 参与者填写了问卷,包括睡前和醒后的睡眠满意度评分。睡前,他们提供了有关身体和心理疲劳、疾病或伤害的存在等问题的答案。醒来后,他们对睡眠满意度和睡眠期间的室内环境进行了评分。睡眠满意度按五点评分:“非常满意”、“满意”、“中性”、“不满意”和“非常不满意”。
- 排除了使用空调设备或有感冒/受伤的参与者数据。
- 选择了三位睡眠满意度差异较大的参与者进行分析。
2.2 实验方法
2.2.1 预处理
- 使用 Kleinberg’s burst extraction 方法从音频中提取睡眠声音事件。
- 将声音事件转换为频域,并使用功率谱作为 VAE 的输入。
- 对连续的声音事件进行下采样,以确保 LSTM 输入序列长度适中。
2.2.2 睡眠声音事件聚类
使用 VAE 学习睡眠声音事件的潜在表示。
使用 GMM 对潜在表示进行聚类,并计算每个事件属于每个聚类的概率。
2.2.3 数据增强
- 通过对事件序列进行多次随机采样,模拟增加天数,以增加训练数据量。
2.2.4 睡眠满意度分类
- 使用 LSTM 对睡眠满意度进行分类,将每个事件属于每个聚类的概率作为输入。
- LSTM 使用 sequence-to-one 方法,将一整晚的事件序列转换为二分类结果(满意或不满意)。
2.2.5解释
- 使用 TimeSHAP 分析 LSTM 模型,解释每个聚类对睡眠满意度分类的影响。
- 分析不同时间段 (早、中、晚) 的重要聚类和特征。
2.3 实验结果
2.3.1 分类结果
- 提出的方法在所有参与者中都取得了较高的睡眠满意度分类准确率,最高达到 94.8%。
- 与传统的 VAE+LSTM 方法相比,提出的方法的准确率更高或相当。
2.3.2 解释结果
- 不同满意度下,重要聚类存在显著差异。
- 个体之间存在睡眠特征差异,例如:
参与者 1:满意时,呼吸声更重要;不满意时,深呼吸声更重要,可能与睡眠呼吸暂停有关。
参与者 2 和 3:噪声在所有时间段都对睡眠产生负面影响。
3 结论
实验结果表明,所提出的方法能够在对夜间的睡眠满意度进行分类时实现高准确度。此外展示了基于睡眠满意度的聚类重要性存在显著差异,证明了所提出的方法能够分析个体的睡眠特征,并识别改进的领域。虽然在实验中获得高准确度,但未来还面临以下挑战:
- 第一项挑战在于个体间最优VAE维度和聚类数量的显著变化。在部署使用所提出方法的睡眠评估应用时,将需要有效的调整方法。
- 第二项挑战涉及睡眠声音事件的手动标记。由于即使是相同事件,不同个体之间的声音也存在差异,因此需要为每个个体标记睡眠声音事件。在大规模部署时,手动标记变得困难。因此,需要通过构建事件分类器和利用迁移学习等方法来简化标记过程。
4相关知识
4.1 多导睡眠图(Polysomnography, PSG)
PSG是监测睡眠情况的最重要的辅助诊断工具,能够同时监测人体在睡眠过程中的多种生理信号和生物电信号。具体来说,PSG可以监测脑电图(EEG)、眼动电图(EOG)、肌电图(EMG)、心电图(ECG)、呼吸动度、血压、血氧饱和度以及腿动等多项生理指标,并能对被检查者白天和夜间行为进行同步的视频记录。
4.2 基于脑电图(EEG)的睡眠监测
脑电图(EEG)是研究睡眠的一个非常重要的工具。脑电信号中包含了大量的生理与病理信息,现代EEG技术(结合其他神经科学工具)在理解非快速眼动(NREM)和快速眼动(REM)睡眠的复杂组织和功能方面具有重要作用。