【脑电信号处理与特征提取】P7-涂毅恒:运用机器学习技术和脑电进行大脑解码

运用机器学习技术和脑电进行大脑解码

科学研究中的大脑解码

比如2019年在Nature上一篇文章,来自UCSF的Chang院士的课题组,利用大脑活动解码语言,帮助一些患者恢复语言功能。
在这里插入图片描述

大脑解码的重要步骤

大脑解码最重要的两步就是信号采集信号解码 ,信号采集就是所说的脑电技术,信号解码就是机器学习的方法。
在这里插入图片描述

机器学习-基本流程

在这里插入图片描述

机器学习-数据采集

  • 数据采集:确保训练和测试数据集充足且具有代表性
    • 充足的数据:确保存在足够多的数据来训练分类器
    • 有代表的数据:确保有意义的变化都可以从训练和测试数据采样得到

机器数据-预处理

  • 预处理:对获取的数据进行调整,金尽可能消除各种来源的噪声
    • 滤波(去除噪声):
      • 有限冲激响应FIR/无限冲激响应IIR滤波
      • 自适应滤波
      • 空间滤波(独立成分分析)等
    • 剔除异常值(outlier removal)
    • 归一化(normalization)

预处理-剔除异常值

异常值(outlier):数值上与其他数据距离过于远的数据,它将极大地影响正确分类器的训练。
比如:被EOG干扰的EEG试次可能是异常值(在幅度上差别极大)。
在这里插入图片描述
典型方法:设置一个阈值,如果样本值大于阈值,则可以将该样本视为异常值。
例如:3标准差原则,剔除超过样本均值3个标准差的样本值(仅局限于正态或近似正态分布的样本)。
在这里插入图片描述

预处理-归一化

  • 归一化(特征缩放):由于原始数据的取值范围变化很大,如果不进行归一化,某些分类器无法正常工作。
  • 例如,大多数分类器会计算两个样本之间的距离。如果其中一个特征的范围很广,则计算的距离将主要受该特定特征的影响。因此需要对所有特征的范围进行归一化,使每个特征对最终距离的贡献成比例

归一化的方法有两种:标准化(standardization)再缩放(re-scaling)
在这里插入图片描述
还有一种情况可采用对数变换:当特征值存在较大差异的时候,使用对数变换来减小特征值的动态范围。
在这里插入图片描述

机器学习-特征提取和选择

当对正眼闭眼状态的EEG进行分类时

  • 重要特征为枕区的 α \alpha α频段能量
  • 冗余特征可能为枕区不同通道的 α \alpha α频段能量
  • 无用特征可能为其它频段其它脑区的EEG能量

Q: 为什么要进行特征提取和选择?
A: 因为数据维数过高会面临无法找到重要特征和过拟合问题,所以需要选择有用的特征进行训练。这里用到的方法叫做降维。

在这里插入图片描述

降维

降维(dimension reduction):主要是由脑电研究中面临的“大数据”挑战所驱动的。

  • 降维的重要性
    少量但信息量大的特征可以显著减少
    • 分类算法的复杂度
    • 运行算法时对时间以及机器的需求
    • 过拟合出现的可能性
  • 特征提取和特征选择都是降维过程

无监督降维-主成分分析

  • 最常见的无监督降维方法为主成分分析(Principal Component Analysis,PCA)

  • PCA通常用于高维特征投影到底维空间中,从而有效地降低维数

  • 在数学上,PCA使用正交变换将相关变量的一组观测值转换为一组被称为主成分(Principal Components,PCs)的线性不相关变量。

  • 主成分分析将观测到的数据转换到一个新的坐标系中,这样对数据进行投影后得到的最大方差就会落在第一个坐标上(即主成分),第二大方差落在第二个坐标上,以此类推。
    在这里插入图片描述
    如何理解选择方差大的特征呢? 因为PCA的目的就是选择重要的特征,重要的特征应该能够区别不同样本,方差大意味着样本在这一个特征下的区分度大,所以我们选择方差大的特征作为主成分。

  • 主成分分析是一种强大的降维工具。

  • 如果一个主成分的方差很小,从数据中删除这个成分后,我们只损失了少量的信息。

  • 假设我们只保留L个主成分,那么新数据将只有L列,但却包含了原始数据中绝大多数的信息
    在这里插入图片描述
    算法如下:
    在这里插入图片描述

  • 主成分分析可应用于脑电分析,以降低以下域上的维数

    • 时间(相邻时间点信号幅度近似)
    • 频率(相邻频率点功率值相似)
    • 空间(相邻通道的脑电相似程度高)
  • 原因:脑电信号在这些域内包涵冗余特征

有监督降维

有监督的降维:利用类标签来确保高纬度数据可以被映射到底维空间,且不同的类可以在这个空间中被很好的区分。
在这里插入图片描述
在这里插入图片描述

机器学习-模型选择与训练

多数分类器为二分类器(输出两个类别),但也有一些分类器允许使用两个以上的类。
多分类:将样本分为L类,其中L>2。
通常来说,多分类是利用常用的二分类器通过不同的策略来实现的:

  • 一对多(One-vs.-Rest)
  • 一对一(One-vs.-One)

模型选择与训练-多分类

在这里插入图片描述
脑电分析中常用的分类器

  • 支持向量机
  • 贝叶斯决策
  • 决策树与随机森林
  • 聚类
  • 神经网络与深度学习

模型选择与训练-支持向量机

  • 支持向量机(Support Vector Machine,SVM)是一类有监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面
    在这里插入图片描述

模型选择与训练-贝叶斯决策

  • 贝叶斯决策(Bayesian Decision Theory)是概率框架下实施的基本方法。对于分类任务来说,在所有相关概念都已知的理想情形下,贝叶斯决策论考虑如何基于这些概念和误判损失选择最优的类别标记。
    在这里插入图片描述

模型选择与训练-决策树与随机森林

  • 决策树(Decision Tree)是一类常见的机器学习方法。顾名思义,决策树是基于书结构来进行决策的。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶节点则对于从根节点到该叶节点所经历的路径所表示的对象的值。
    在这里插入图片描述

模型选择与训练-聚类

  • 聚类:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。
    在这里插入图片描述

模型选择与训练-神经网络与深度学习

在这里插入图片描述

机器学习-评估

利用训练数据完成模型选择和训练后,需要在测试数据进行广泛化性能评估
在这里插入图片描述
评估的方法之一是交叉验证
在这里插入图片描述
评估的性能度量指标
在这里插入图片描述
所以需要其它指标来进一步评估分类器性能
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/249671.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Coremail启动鸿蒙原生应用开发,打造全场景邮件办公新体验

1月18日,华为在深圳举行鸿蒙生态千帆启航仪式,Coremail出席仪式并与华为签署鸿蒙合作协议,宣布正式启动鸿蒙原生应用开发。作为首批拥抱鸿蒙的邮件领域伙伴,Coremail的加入标志着鸿蒙生态版图进一步完善。 Coremail是国内自建邮件…

浏览器——HTTP缓存机制与webpack打包优化

文章目录 概要强缓存定义开启 关闭强缓存协商缓存工作机制通过Last-Modified If-Modified-Since通过ETag If-None-Match 不使用缓存前端利用缓存机制,修改打包方案webpack 打包webpack 打包名称优化webpack 默认的hash 值webapck其他hash 类型配置webpack打包 web…

数据结构-内部排序

简介 排序(Sorting):将一个数据元素(或记录)的任意序列,重新排列成一个按关键字有序的序列 排序算法分为内部排序和外部排序 内部排序:在排序期间数据对象全部存放在内存的排序 外部排序&am…

MySQL-运维-主从复制

一、概述 二、原理 三、搭建 1、服务器准备 2、主库配置 (1)、修改配置文件/etc/my.cnf (2)、重启MySQL服务器 (3)、登录mysql,创建远程链接的账号,并授予主从复制权限 &#xff0…

3593 蓝桥杯 查找最大元素 简单

3593 蓝桥杯 查找最大元素 简单 // C风格解法1&#xff0c;通过率100%&#xff0c;多组数据处理样式//str "abcdefgfedcba" //abcdefg(max)fedcba//str "xxxxx" //x(max)x(max)x(max)x(max)x(max)#include<bits/stdc.h>const int N 1e2 10;char …

分类预测 | Matlab实现SCN-Adaboost随机配置网络模型SCN的Adaboost数据分类预测/故障识别

分类预测 | Matlab实现SCN-Adaboost随机配置网络模型SCN的Adaboost数据分类预测/故障识别 目录 分类预测 | Matlab实现SCN-Adaboost随机配置网络模型SCN的Adaboost数据分类预测/故障识别分类效果基本描述程序设计参考资料 分类效果 基本描述 1.Matlab实现SCN-Adaboost随机配置网…

vue——实现多行粘贴到table事件——技能提升

最近在写后台管理系统时&#xff0c;遇到一个需求&#xff0c;就是要从excel表格中复制多行内容&#xff0c;然后粘贴到后台系统中的table表格中。 如下图所示&#xff1a;一次性复制三行内容&#xff0c;光标放在红框中的第一个框中&#xff0c;然后按ctrlv粘贴事件&#xff0…

C#,桌面游戏编程,数独游戏(Sudoku Game)的算法与源代码

本文包括以下内容&#xff1a; &#xff08;1&#xff09;数独游戏的核心算法&#xff1b; &#xff08;2&#xff09;数独游戏核心算法的源代码&#xff1b; &#xff08;3&#xff09;数独游戏的部分题目样本&#xff1b; &#xff08;4&#xff09;适老版《数独》的设计原则…

WordPress如何使用SQL实现一键关闭/开启评论功能(已有评论)

WordPress本人就自带评论功能&#xff0c;不过由于种种原因&#xff0c;有些站长不想开启评论功能&#xff0c;那么应该怎么实现一键关闭评论功能或开启评论功能呢&#xff1f;或者针对已有评论功能的文章进行一键关闭或开启评论功能应该怎么操作&#xff1f; 如果你使用的Wor…

Walrus 0.5发布:重构交互流程,打造开箱即用的部署体验

开源应用管理平台 Walrus 0.5 已于近日正式发布&#xff01; Walrus 0.4 引入了全新应用模型&#xff0c;极大程度减少了重复的配置工作&#xff0c;并为研发团队屏蔽了云原生及基础设施的复杂度。Walrus 0.5 在这一基础上&#xff0c;通过重构交互流程、增强抽象能力&#xff…

【tensorflow 版本 keras版本】

#. 安装tensorflow and keras&#xff0c; 总是遇到版本无法匹配的问题。 安装之前先查表 https://master--floydhub-docs.netlify.app/guides/environments/ 1.先确定你的python version 2.再根据下面表&#xff0c;确定安装的tesorflow, keras

废品上门回收小程序搭建全过程

随着人们对环境保护意识的不断增强&#xff0c;废品回收成为了一项重要的社会活动。为了方便废品回收的顾客和回收者之间的联系&#xff0c;废品上门回收小程序成为了一种流行的解决方案。然而&#xff0c;如何选择一款合适的废品上门回收小程序搭建平台呢&#xff1f;下面将为…

缓存相关问题记录解决

缓存相关问题 在这里我不得不说明,我写的博客都是我自己用心写的,我自己用心记录的,我写的很详细,所以会有点冗长,所以如果你能看的下去的化,会有所收获,我不想写那种copy的文章,因为对我来说没什么益处,我写的这篇博客,就是为了记录我缓存的相关问题,还有我自己的感悟,所以如果…

elementUI实现selecttree自定义下拉框树形组件支持多选和搜索

elementUI实现selecttree自定义下拉框树形组件支持多选和搜索 效果图定义子组件父组件应用 效果图 定义子组件 主要结合el-select和el-tree两个组件改造的。 <template><div class"selectTree"><el-select filterable :filter-method"filterMe…

有趣的css - 动态的毛玻璃背景

页面效果 此效果主要使用 backdrop-filter 属性&#xff0c;以及配合 animation 属性来实现毛玻璃模糊和一些动效。 此效果可适用于登录窗口&#xff0c;网站背景或者一些卡片列表中&#xff0c;使网页更具科技感和空间感。 核心代码部分&#xff0c;简要说明了写法思路&#x…

RK3588开发板Ubuntu与开发板使用U盘互传

1 将 U 盘(U 盘的格式必须为 FAT32 格式&#xff0c;大小在 32G 以下)插到开发板的 usb 接口&#xff0c;串口打印信息如下所示&#xff0c;U 盘的设备节点是/dev/sdb4。U 盘的设备节点不是固定的&#xff0c;根据实际情况来查看设备节点。 2 输入以下命令挂载 U 盘&#xff0c…

计算机网络_1.4 计算机网络的定义和分类

1.4 计算机网络的定义和分类 一、计算机网络的定义&#xff08;无唯一定义&#xff09;二、计算机网络的分类&#xff08;从不同角度分类&#xff09;1、交换方式2、使用者3、传输介质4、覆盖范围5、拓扑结构 笔记来源&#xff1a; B站 《深入浅出计算机网络》课程 一、计算机…

Flask 入门2:路由

1. 前言 在上一节中&#xff0c;我们使用到了静态路由&#xff0c;即一个路由规则对应一个 URL。而在实际应用中&#xff0c;更多使用的则是动态路由&#xff0c;它的 URL是可变的。 2. 定义一个很常见的路由地址 app.route(/user/<username>) def user(username):ret…

安全防御第五次作业

拓扑图及要求如下&#xff1a; 实验注意点&#xff1a; 先配置双机热备&#xff0c;再来配置安全策略和NAT两台双机热备的防火墙的接口号必须一致双机热备时&#xff0c;请确保vrrp配置的虚拟IP与下面的ip在同一网段如果其中一台防火墙有过配置&#xff0c;最好清空或重启&…

基于 Echarts 的 Python 图表库:Pyecahrts交互式的日历图和3D柱状图

文章目录 概述一、日历图和柱状图介绍1. 日历图基本概述2. 日历图使用场景3. 柱状图基本概述4. 柱状图使用场景 二、代码实例1. Pyecharts绘制日历图2. Pyecharts绘制2D柱状图3. Pyecharts绘制3D柱状图 总结 概述 本文将引领读者深入了解数据可视化领域中的两个强大工具&#…