Python数据分析-风湿关节炎生存分析

一、研究背景和意义

类风湿关节炎(RA)是一种慢性炎症性疾病,主要影响关节,但也可能影响身体的其他部分。RA的病因尚不完全清楚,但已知其涉及免疫系统的异常反应。患者的免疫系统错误地攻击自身的关节组织,导致炎症、疼痛和关节损伤。RA的长期影响可能包括关节变形、功能丧失和生活质量的显著下降。此外,RA还与心血管疾病等全身性并发症密切相关。在RA的管理和治疗中,早期诊断和干预至关重要。尽管已有多种治疗方法(如药物治疗和物理治疗)用于缓解症状和延缓疾病进展,
但许多患者仍可能经历疾病的急性发作(failure)和血管闭塞(occlusion)。这些急性事件不仅影响患者的健康和生活质量,还增加了医疗负担和社会成本。

二、研究意义

提高早期诊断和预测能力:通过构建预测模型,本研究能够识别出RA患者在未来可能经历急性发作或血管闭塞的高风险个体,从而实现早期干预和个性化治疗。这不仅有助于提高患者的生活质量,还能有效降低医疗成本。

为临床决策提供支持:本研究的预测模型可作为临床医生的辅助工具,帮助他们在治疗决策过程中考虑更多的变量和因素,从而制定更为科学和有效的治疗方案。

推动RA研究的发展:通过深入分析多种生理和病理指标与RA急性事件之间的关系,本研究为RA的病理机制研究提供了新的视角和数据支持,有助于揭示RA的复杂病理机制,推动相关基础研究的发展。

三、实证分析

读取数据集

数据和代码

import pandas as pd# 加载数据
file_path = 'interpolation_RA_baseline_anytime_failure.csv'
data = pd.read_csv(file_path)
data.head()

查看数据基本信息 

检查缺失值

可以发现没有缺失值

接下来检查检查重复值

接下来进行描述性统计分析

接下来绘制每个特征的直方图

# 绘制分布图,每行6个图
num_plots = len(numerical_columns)
fig, axes = plt.subplots(num_plots // 6 + 1, 6, figsize=(20, 5 * (num_plots // 6 + 1)))for i, column in enumerate(numerical_columns):row, col = divmod(i, 6)sns.histplot(data[column].dropna(), kde=True, ax=axes[row, col])axes[row, col].set_title(f'Distribution of {column}')# 删除多余的子图
for j in range(i + 1, len(axes.flatten())):fig.delaxes(axes.flatten()[j])plt.tight_layout()
plt.show()

 

计算相关矩阵

也可以绘制热力图

plt.figure(figsize=(12, 8))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
plt.title('Correlation Matrix')
plt.show()

 接下来进行回归分析
线性回归和逻辑回归

# 线性回归
X = data[numerical_columns_with_target]
y = data['RAfailureanytime']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)linear_model = LinearRegression()
linear_model.fit(X_train, y_train)
linear_predictions = linear_model.predict(X_test)# 逻辑回归
logistic_model = LogisticRegression(max_iter=1000)
logistic_model.fit(X_train, y_train)
logistic_predictions = logistic_model.predict(X_test)

 

还可以使用其他模型

from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.svm import SVC# 决策树
decision_tree = DecisionTreeClassifier()
decision_tree.fit(X_train, y_train)
dt_predictions = decision_tree.predict(X_test)# 随机森林
random_forest = RandomForestClassifier()
random_forest.fit(X_train, y_train)
rf_predictions = random_forest.predict(X_test)# 支持向量机
svc_model = SVC(probability=True)
svc_model.fit(X_train, y_train)
svc_predictions = svc_model.predict(X_test)

 

接下来进行生存分析
生存曲线和Cox回归模型

# Cox回归模型
cox_model = CoxPHFitter()
cox_model.fit(data, duration_col='failuretime', event_col='RAfailureanytime')
cox_model.print_summary()

 

四、结论

本研究通过分析一组包含多种临床和生理指标的RA患者数据,构建了线性回归和逻辑回归模型,用于预测RA患者的急性发作和血管闭塞情况。

研究结果显示,模型在分类和预测方面表现出较高的准确性和可靠性。具体来说,逻辑回归模型的整体准确率为88%,在精确度、召回率和F1评分等方面均表现良好。ROC曲线的AUC值表明模型具有较高的分类性能,能够有效区分高风险和低风险患者。通过本研究的成果,临床医生可以更早地识别出高风险患者,从而采取早期干预措施,减少急性事件的发生率。此外,本研究还为进一步的RA病理机制研究提供了数据支持,推动了RA研究的发展。

未来,随着数据量的增加和模型的不断优化,预测模型的准确性和应用范围将进一步提升。我们希望本研究的成果能够在实际临床中得到应用,为RA患者的管理和治疗带来实质性的改善。同时,我们也期待更多的研究者参与到这一领域,共同探索和解决RA这一复杂疾病带来的挑战。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/364630.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STM32音频应用开发:DMA与定时器的高效协作

摘要: 本文章将深入浅出地介绍如何使用STM32单片机实现音频播放功能。文章将从音频基础知识入手,逐步讲解音频解码、DAC转换、音频放大等关键环节,并结合STM32 HAL库给出具体的代码实现和电路设计方案。最后,我们将通过一个实例演示如何播放W…

Maven的依赖传递、依赖管理、依赖作用域

在Maven项目中通常会引入大量依赖,但依赖管理不当,会造成版本混乱冲突或者目标包臃肿。因此,我们以SpringBoot为例,从三方面探索依赖的使用规则。 1、 依赖传递 依赖是会传递的,依赖的依赖也会连带引入。例如在项目中…

云计算【第一阶段(21)】Linux引导过程与服务控制

目录 一、linux操作系统引导过程 1.1、开机自检 1.2、MBR引导 1.3、GRUB菜单 1.4、加载 Linux 内核 1.5、init进程初始化 1.6、简述总结 1.7、初始化进程centos 6和7的区别 二、排除启动类故障 2.1、修复MBR扇区故障 2.1.1、 实验 2.2、修复grub引导故障 2.2.1、实…

红队内网攻防渗透:内网渗透之内网对抗:横向移动篇Kerberos委派安全RBCD资源Operators组成员HTLMRelay结合

红队内网攻防渗透 1. 内网横向移动1.1 横向移动-资源约束委派-利用域用户主机加入1.1.1 利用思路1.1.2 利用条件1.1.3 利用过程1.2 横向移动-资源约束委派-Acount Operators组1.2.1 利用思路:1.2.2 利用条件:1.2.3 利用过程:1.3 横向移动-资源约束委派-CVE结合HTLMRelay1.3.…

哥斯拉短视频:成都柏煜文化传媒有限公司

哥斯拉短视频:巨兽传奇的视听盛宴 在短视频的海洋中,成都柏煜文化传媒有限公司 有一种特殊的存在总能吸引人们的目光,那就是以哥斯拉为主题的短视频。这些视频以震撼的视觉效果、扣人 ​心弦的剧情和独特的怪兽文化,为我们呈现了…

SHELL脚本学习(十二)sed进阶

一、多行命令 概述 sed 编辑器的基础命令都是对一行文本进行操作。如果要处理的数据分布在多行中,sed基础命令是没办法处理的。 幸运的是,sed编辑器的设计人员已经考虑了这个问题的解决方案。sed编辑器提供了3个处理多行文本的特殊命令。 命令描述N加…

NPOI入门指南:轻松操作Excel文件的.NET库

目录 引言 一、NPOI概述 二、NPOI的主要用途 三、安装NPOI库 四、NPOI基本使用 六、性能优化和内存管理 七、常见问题与解决方案 八、结论 附录 引言 Excel文件作为数据处理的重要工具,广泛应用于各种场景。然而,在没有安装Microsoft Office的…

PySide(PyQt)在图像上画线

1、按鼠标左键任意画线 import sys from PySide6.QtWidgets import QApplication, QLabel, QVBoxLayout, QWidget from PySide6.QtGui import QPainter, QPixmap, QMouseEvent, QColor, QPen from PySide6.QtCore import Qt, QPointclass PaintLabel(QLabel):def __init__(self…

本教程将指导如何通过 Vue 组件和后端 API 交互

本人详解 作者:王文峰,参加过 CSDN 2020年度博客之星,《Java王大师王天师》 公众号:JAVA开发王大师,专注于天道酬勤的 Java 开发问题中国国学、传统文化和代码爱好者的程序人生,期待你的关注和支持!本人外号:神秘小峯 山峯 转载说明:务必注明来源(注明:作者:王文峰…

Redis 集群模式

一、集群模式概述 Redis 中哨兵模式虽然提高了系统的可用性,但是真正存储数据的还是主节点和从节点,并且每个节点都存储了全量的数据,此时,如果数据量过大,接近或超出了 主节点 / 从节点机器的物理内存,就…

【Python系列】列表推导式:简洁而强大的数据操作工具

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

洛谷 P1548 [NOIP1997 普及组] 棋盘问题

题目 洛谷 P1548 [NOIP1997 普及组] 棋盘问题 [NOIP1997 普及组] 棋盘问题 题目背景 NOIP1997 普及组第一题 题目描述 设有一个 N M N \times M NM 方格的棋盘 ( 1 ≤ N ≤ 100 , 1 ≤ M ≤ 100 ) (1≤N≤100,1≤M≤100) (1≤N≤100,1≤M≤100) 求出该棋盘中包含有多少个正…

【Hadoop学习笔记】认识Hadoop

认识Hadoop 从网上找的课程做的笔记,有些图是自己理解画的,可能不正确,可以作为参考,有疑问的地方请直接指出,共同交流。 Hadoop是由Apache基金会开发的一个分布式系统基础架构,主要解决海量数据的存储和海…

不知道自己的优势擅长和兴趣爱好,我该如何填报高考志愿选专业?

天生我才必有用,每个人都是独立的个体,拥有自己的优势和擅长,当然这个优势和擅长,不是和别人对比,而是和自己对比产生的。 如果说你不知道自己的优势擅长,不知道自己的兴趣和爱好,那只不过是你没…

HarmonyOS APP应用开发项目- MCA助手(持续更新中~)

简言: gitee地址:https://gitee.com/whltaoin_admin/money-controller-app.git端云一体化开发在线文档:https://developer.huawei.com/consumer/cn/doc/harmonyos-guides-V5/agc-harmonyos-clouddev-view-0000001700053733-V5 注&#xff1…

架构师篇-7、企业安全架构设计及实践

摘要: 认识企业安全架构企业安全案例分析及实践 内容: 为什么做企业安全架构怎么做好安全架构设计案例实践分析&随堂练 为什么要做企业安全架构 安全是麻烦制造者? 整天提安全需求增加开发工作增加运维要求增加不确定性延后业务上线…

【Docker】docker 替换宿主与容器的映射端口和文件路径

every blog every motto: You can do more than you think. https://blog.csdn.net/weixin_39190382?typeblog 0. 前言 docker 替换宿主与容器的映射端口和文件夹 1. 正文 1.1 关闭docker 服务 systemctl stop docker1.2 找到容器的配置文件 cd /var/lib/docker/contain…

thymeleaf+mybatis(本文章用于期末考前10分钟速看)

期末速看 pom(了解)application.propertiessql代码Controller控制层视图service: 服务层mapper(dao):持久层entity层(model层,domain层、 bean):对应数据库表,实体类 效果…

BIM 模型三维展示方式

三维模型展示场景目前主流的使用 threejs ,bably.js 引擎框架作为开发展示;对于特殊的封闭式模型格式需要二次转换处理;今天推荐一款直接将模型碎片化处理方式,同时能够在网页加载速度快,性能也很流畅,先看结果&#x…

llama3模型部署时遇到的问题及解决方案

在llama3模型部署时,会遇到一系列问题,这里就作者所遇到的问题与解决方法分享一下。 注意:这里是从llama3 github主页上给的方法一步步做的,不适用于其他部署大模型的方法。 文章目录 ERROR 403:Forbidden安装依赖时出…