时序论文41 | Medformer:基于多粒度patch的时序分类模型

图片

论文标题:Medformer: A Multi-Granularity Patching Transformer for Medical Time-Series Classification

论文链接:https://arxiv.org/abs/2405.19363

代码链接:https://github.com/DL4mHealth/Medformer.

(后台回复“交流”加入讨论群,回复“资源”获取2024年度论文讲解合集)

研究思路

这篇虽然不是做的预测任务,而且用的也是医学数据集,但是还是推荐大家快速阅读一下,学习patch的一种创新思路。简单来说,论文的核心贡献就是把所有的patch切法都枚举了一遍,这也是核心看点。先看下面的图,Transformer是点编码,Itransformer是编码整条序列,Patch TST则是切片。可以看到原始Transformer是通道依赖,而iTransformer和PatchTST则是通道独立。

图片

与已有的模型不同,本文则是通道依赖,而且作者设计了一种多粒度patch切分方法,把从L1-Ln的长度全部切分了一遍,文章称之为跨通道多粒度patch嵌入,在此基础上作者还在路由、注意力机制方面做了一些改进,模型名为Medformer,专门用于医疗时间序列(MedTS)分类。

本文模型

模型结构比较容易看明白,左侧A是骨干网络,就是Transformer,核心贡献有两部分,分别在嵌入层和注意力层,分别对应“跨通道多粒度patch嵌入”和“多粒度自注意力”。

图片

01 跨通道多粒度patch嵌入

这部分主要用于从多通道时间序列数据中提取具有不同时间尺度和频率特征的patch。首先,输入的多变量时间序列样本被分割成多个跨通道的非重叠patch,每个patch的长度由一组不同的值确定。

然后,这些patch通过线性投影映射到潜在嵌入空间,并进行数据增强以提高模型的学习能力。为了捕捉不同粒度的时间特征,引入位置嵌入和粒度嵌入,以生成最终的序列嵌入,如下所示:

图片

最后,为每个粒度初始化一个路由器,用于在多粒度自注意力机制中进行信息交互,捕捉多通道时间序列数据中的跨通道特征,并在不同的时间尺度和频率范围内学习特征,从而增强了模型在医疗时间序列分类任务中的适用性。

图片

02 多粒度自注意力

多粒度自注意力机制从不同尺度捕捉特征,并整合跨不同时间分辨率的信息。该机制包括两个阶段:

1. 内粒度自注意力(Intra-Granularity Self-Attention):该阶段捕捉每个粒度内的独特特征。对于每个patch长度(粒度),patch嵌入与路由器嵌入连接形成中间序列。然后对这些patch嵌入和路由器嵌入应用自注意力,以捕捉同一粒度内的局部时间特征和相关性。

2. 跨粒度自注意力(Inter-Granularity Self-Attention):该阶段捕捉不同粒度之间的相关性。将所有粒度的路由器嵌入连接起来形成一个路由器序列。对这些路由器嵌入应用自注意力,允许在不同粒度之间交换信息和学习。

通过结合这两个阶段,Medformer有效地整合了不同时间尺度上的特征,增强了模型捕捉细粒度和大粒度模式的能力。相比简单地连接所有patch并对其进行自注意力的方式,降低了计算复杂性。

本文实验

图片

图片

在ADFTD数据集上,Medformer在所有六个评估指标中均取得最高排名,F1得分为97.50%。其他基线方法如Informer、Nonformer、Reformer和Transformer也表现出色,F1得分超过90%。受试者独立设置: 在四个数据集上,Medformer在F1得分上取得最高排名。在ADFTD数据集上,F1得分显著下降至50.65%,表明受试者独立设置的挑战性。总体而言,Medformer在六个指标中的平均排名最佳。

不足和可改进之处

高复杂度问题:Transformer老生常谈的问题,尽管论文设计了路由器机制来降低时间复杂度,但 Transformer 架构本身在处理大规模数据时仍可能面临计算资源消耗大、训练时间长的问题。是否可以通过下采样等方法、稀疏注意力机制、量化技术,以减少计算量和内存占用。

多模态数据融合:目前的研究仅关注了单一类型的医学时间序列数据,是否可以探索将 Medformer 模型扩展到多模态数据融合的场景?


大家可以关注我【科学最top】,第一时间follow时序高水平论文解读!!!,后台回复“交流”加入讨论群,回复“资源”获取2024年度论文讲解合集

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25042.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

建筑兔零基础自学python记录32|学过的函数代码记录19-25

这是之前matplotlib用过的代码记录,以防忘记记录一下: 19.price_data 是一个 NumPy 记录股票数组。每一列可以有不同的数据类型,并且每列都有一个对应的字段名。(类似excel的表中的列) date:存储交易日期&#xff0c…

面试八股文--数据库基础知识总结(2) MySQL

本文介绍关于MySQL的相关面试知识 一、关系型数据库 1、定义 关系型数据库(Relational Database)是一种基于关系模型的数据库管理系统(DBMS),它将数据存储在表格(表)中,并通过表格…

Linux:目录创建命令mkdir功能及用法详解

mkdir是Make Directory的缩写,该命令在 Linux 中用于创建目录(单层或多层),在Linux中很常用,可以说是基础性命令。该命令支持:1)创建单层或多层目录2)直接指定目录权限。本文详细介绍…

2024年国赛高教杯数学建模D题反潜航空深弹命中概率问题解题全过程文档及程序

2024年国赛高教杯数学建模 D题 反潜航空深弹命中概率问题 原题再现 应用深水炸弹(简称深弹)反潜,曾是二战时期反潜的重要手段,而随着现代军事技术的发展,鱼雷已成为现代反潜作战的主要武器。但是,在海峡或…

Visual Studio Code 远程开发方法

方法1 共享屏幕远程控制,如 to desk, 向日葵 ,像素太差,放弃 方法2 内网穿透 ssh 第二个方法又很麻烦,尤其是对于 windows 电脑,要使用 ssh 还需要额外安装杂七杂八的东西;并且内网穿透服务提供商提供的…

SQLite 安装教程以及可视化工具介绍

目录 简述 1. Windows 系统安装 1.1 下载预编译的二进制文件 1.2 解压文件 1.3 配置环境变量 1.4 验证安装 2. GUI 可视化工具 2.1 免费工具 2.1.1 DB Browser for SQLite 2.1.2 SQLiteStudio 2.1.3 SQLite Expert 2.1.4 SQLiteGUI 2.1.5 Antares SQL 2.1.6 DbGa…

smolagents学习笔记系列(五)Tools-in-depth-guide

这篇文章锁定官网教程中的 Tools-in-depth-guide 章节,主要介绍了如何详细构造自己的Tools,在之前的博文 smolagents学习笔记系列(二)Agents - Guided tour 中我初步介绍了下如何将一个函数或一个类声明成 smolagents 的工具&…

LLM2CLIP论文学习笔记:强大的语言模型解锁更丰富的视觉表征

1. 写在前面 今天分享的一篇论文《LLM2CLIP: P OWERFUL L ANGUAGE M ODEL U NLOCKS R ICHER V ISUAL R EPRESENTATION》, 2024年9月微软和同济大学的一篇paper, 是多模态领域的一篇工作,主要探索了如何将大模型融合到Clip模型里面来进一步提…

一键部署DeepSeek

腾讯Cloud Studio提供DeepSeek一键部署功能,0行代码,秒级部署使用! 重点是每月免费提供10000分钟! 不用等待模型下载,创建即可使用。 内置 Ollama、DeepSeek-R1 1.5B、7B、8B、14B 及 32B 模型。 热门模板 AI模板 前…

【计算机网络】IP协议

目录 1. 协议头格式 2. 网段划分 3. 特殊的IP 4. 公网IP && 内网IP 总结 网络层的IP协议主要解决的是什么问题?——将数据包从B主机发送给C主机;传输层协议tcp提供可靠的策略;网络层IP协议提供数据数据传输的能力; 发…

YOLOv12 ——基于卷积神经网络的快速推理速度与注意力机制带来的增强性能结合

概述 实时目标检测对于许多实际应用来说已经变得至关重要,而Ultralytics公司开发的YOLO(You Only Look Once,只看一次)系列一直是最先进的模型系列,在速度和准确性之间提供了稳健的平衡。注意力机制的低效阻碍了它们在…

2022年全国职业院校技能大赛网络系统管理赛项模块A:网络构建(样题6)-网络部分解析-附详细代码

目录 附录1:拓扑图 附录2:地址规划表 1.SW1 2.SW2 3.SW3 4.SW4 5.VSU 6.SW7 7.R1 8.R2 9.R3 10.AC1 11.AC2 12.EG1 13.EG2 附录1:拓扑图 附录2:地址规划表

C#实现本地Deepseek模型及其他模型的对话

前言 1、C#实现本地AI聊天功能 WPFOllamaSharpe实现本地聊天功能,可以选择使用Deepseek 及其他模型。 2、此程序默认你已经安装好了Ollama。 在运行前需要线安装好Ollama,如何安装请自行搜索 Ollama下载地址: https://ollama.org.cn Ollama模型下载地址&#xf…

突破“第一崇拜“:五维心理重构之路

一、视频介绍 在这个崇尚"第一"的时代,我们如何找到自己的独特价值?本视频将带您踏上五维心理重构之旅,从诗意人生的角度探讨如何突破"圣人之下皆蝼蚁"的局限。我们将穿越人生的不同阶段,从青春的意气风发到…

SpringWeb

目录 一.SpringWeb 1.SpringWeb 概述 2.SpringWEB 特点 3.SpringWeb 运行流程 4.SpringWEB 组件 二.搭建SpringWeb 1.在pom.xml中导包 2.配置DispatcherServlet 3.开启SpringWEB注解 4.测试 三.接收请求 1.定义地址、请求方式 2.获取请求数据 1)使用r…

性能测试的方案编写与执行步骤

性能测试计划书 在测试过程中我们如果编写一份性能测试计划书,需要一下几个背景板块及要点 性能测试的流程: 确认需求(确认正确的需求) —>编写测试方案(准备怎么动手)测试环节—>(尽量与生成配置一…

[AI]从零开始的树莓派运行DeepSeek模型教程

一、前言 在前面的教程中,教了大家如何在windows中使用llama.cpp来运行DeepSeek模型。根据前面的教程中,我们也了解到了,我们只需要编译好llama.cpp就可以运行DeepSeek以及类似的LLM模型。那么本次教程就来教大家如何使用树莓派来运行大模型。…

03_pyqt5 + vlc 实现视频播放器

1.功能需求如图 按钮: 播放/暂停, 前进/后退, 视频上一个/下一个, 打开视频进度条: 视频进度条显示, 进度条拖拽, 音量控制按键控制: 1,2,3,4缩放画面大小, 2.方案选择 开发语言: python UI界面: pyqt5 qt_designed 设计ui布局 视频编码: python-vlc 方案说明: 视频解码可…

Linux——高级IO(select后续poll,epoll)

目录 一、poll函数 1.函数原型 2.参数说明 3.struct pollfd 结构体 4.返回值 5.使用步骤 6.与 select 的对比 7.适用场景 8.缺点 9.总结 二、epoll函数 1.核心思想 2.核心函数 1. epoll_create - 创建 epoll 实例 2. epoll_ctl - 管理 epoll 事件表 3. epoll_w…

基于 ‌MySQL 数据库‌对三级视图(用户视图、DBA视图、内部视图)的详细解释

基于 ‌MySQL 数据库‌对三级视图(用户视图、DBA视图、内部视图)的详细解释,结合理论与实际操作说明: 一、三级视图核心概念 数据库的三级视图是 ANSI/SPARC 体系结构的核心思想,MySQL 的实现逻辑如下: …