辨析常见的医学数据分析(相关性分析回归分析)

目录

1 常见的三种分类结果?

2 什么是相关性分析?

        相关性分析的结果怎么看?

3 什么是回归分析?

        1)前提

        2)常见的回归模型

4 对于存在对照组实验的医学病例如何分析?

1)卡方检验

2)Fisher 精确概率法


        为了更好理解下述辨析,假设有一份关于膝关节骨性关节炎的数据:(注:这里仅为示意,没有任何医学借鉴含义)

患者编号年龄性别BMI是否为关节炎关节炎严重程度软骨损伤类型
00160023.41-是轻度1-软骨软化
00256126.11-是中度2-软骨裂隙
00364025.51-是轻度3-局灶性缺损
00463026.81-是重度4-弥漫性变薄
*软骨损伤类型的分类方式参考了文献《Deep Learning Approach for Evaluating Knee MR Images: Achieving High Diagnostic Performance for Cartilage Lesion Detection》

1 常见的三种分类结果?

        二元分类:e.g. 是/否 为关节炎

        多元有序分类:疾病严重程度的分级(分类结果有序等差,e.g.轻度、中度、重度依次等差递增

        多元无序分类:疾病的种类,e.g.肺癌、乳腺癌、胃癌,这里如软骨损伤的类型。这些分类结果没有等级上的关系,都是并列关系的诊断结果。

2 什么是相关性分析?

        两个变量之间是否存在相关性及计算相关程度的大小

        主要分为两类:线性相关 && 秩相关

线性相关分析秩相关分析
类型参数检验非参数检验
数据需求双定量变量(连续型数值变量),均满足正态分布定量或等级变量,即至少有一个变量为偏态分布或等级变量
分析方法Pearson相关Spearman相关
相关系数Pearson相关系数,rSpearman相关系数,r_{s}
p值与结论p<0.05:两变量总体线性相关p<0.05:两变量总体相关
r值与结论

|r| > 0.8,两变量存在极强的相关;

0.6 < |r| < 0.8,强相关;

0.4 < |r| < 0.6,中等相关;

|r| < 0.4,弱相关。

        相关性分析的结果怎么看?

                ①先看显著性p值,(变量间是否存在显著性影响的关系)只有存在显著性相关(即 p < 0.05),再分析r值;(若不存在相关性,考虑筛选别的影响因子纳入表格)

                ②看相关性系数r值,判断变量间是显著强相关/中等相关/弱相关。

3 什么是回归分析?

        如果说,相关性分析是看自变量对因变量是否有影响,那么,回归分析是看自变量如何影响因变量的模型拟合。

        相关性分析基于两两变量直接的关系探究;而回归分析一次性纳入了所有可能相关的变量,模拟真实的环境以找到真正有独立影响性的因素,并得到这些因素是如何作用的。

        1)前提

        建立回归模型的多变量不能存在共线性的关系(如,BMI是由身高与体重的线性计算公式得到的,那么建立模型时就不能同时纳入BMI和体重两个自变量)

        2)常见的回归模型

二元Logistic回归适用于二元分类(是否发生疾病)
多元有序Logistic回归适用于多元有序分类
多元无序Logistic回归适用于多元无序分类
Cox回归

含有“时间数据”的二元Logistic回归

(疾病发生的速度

4 对于存在对照组实验的医学病例如何分析?

1)卡方检验

        卡方检验进行分析的目的是比较差异性

        建立了两组假设:①零假设:观察组和对照组的作用结果一致。(如,某新药物【观察组】和常规药物【对照组】的疗效一致。)

                                     ②备选假设:观察组和对照组的作用结果显著不一致。(如,想要证实新药物的疗效更好。)

        卡方检验的p值<0.05,则拒绝零假设,接受备选假设;反之,接受零假设。

        参考:卡方(χ2),四格表应用条件,理论频数_weixin_34307464的博客-CSDN博客,由于基于卡方分布模型,使用卡方检验的前提:①样本总量>40;②四格表的理论频数≠0并且理论频数<5的样本不超过总样本数的20%。

2)Fisher 精确概率法

        对于小样本,或四格表的理论频数=0的情况,使用Fisher 精确概率法。

        目的: 以超几何分布为理论模型,用来检验一次随机实验的结果是否支持对于某个随机实验的假设,当测试结果出现小概率事件则认定原有假设不被支持。

        同样地,Fisher 检验的p值<0.05,则拒绝零假设。

        与卡方检验的区别在于:在实际计算当中分为单边检验(即超几何检验)和双边检测。实际应用中,Fisher检验前先有一个预期,如:想要得到新药比常规药的有效概率更大,则选择Fisher检验的“大于”的单侧;若只是想要得到新药与常规药的有效性有差异,则选择Fisher双边检测。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/140301.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Newman+Jenkins】实施接口自动化测试

一、是什么Newman Newman就是纽曼手机这个经典牌子&#xff0c;哈哈&#xff0c;开玩笑啦。。。别当真&#xff0c;简单地说Newman就是命令行版的Postman&#xff0c;查看官网地址。 Newman可以使用Postman导出的collection文件直接在命令行运行&#xff0c;把Postman界面化运…

pytest框架前后置设置,以及pytest默认规则

一、pytest框架的默认规则 1、模块名默认必须以test开头或者以test结尾 2、测试类必须以Test开头&#xff0c;并且不能有__init__方法 3、测试方法默认必须以test开头 当然以后的一些默认规则除测试类不能使用__init__方法外其余的都是可配置的&#xff0c;当然一般情况下我们…

C/C++好题分享--代码题

2-1排序子序列 int main() {int n;cin >> n;// 注意这里多给了一个值&#xff0c;是处理越界的情况的比较&#xff0c;具体参考上面的解题思路vector<int> a;a.resize(n 1);//这里有个坑&#xff0c;这个题越界了牛客测不出来&#xff0c;给n,并且不写a[n] 0;不会…

SpringCloud Gateway--Predicate/断言(详细介绍)上

&#x1f600;前言 本篇博文是关于SpringCloud Gateway–Predicate/断言&#xff08;详细介绍&#xff09;上&#xff0c;希望你能够喜欢 &#x1f3e0;个人主页&#xff1a;晨犀主页 &#x1f9d1;个人简介&#xff1a;大家好&#xff0c;我是晨犀&#xff0c;希望我的文章可以…

Vue中的路由介绍以及Node.js的使用

&#x1f3c5;我是默&#xff0c;一个在CSDN分享笔记的博主。&#x1f4da;&#x1f4da; &#x1f31f;在这里&#xff0c;我要推荐给大家我的专栏《Vue》。&#x1f3af;&#x1f3af; &#x1f680;无论你是编程小白&#xff0c;还是有一定基础的程序员&#xff0c;这个专栏…

数据结构之顺序表

前言 顺序表采用模块化编程思路&#xff0c;顺序表的实现使用3个模块&#xff0c;test.c—测试模块 Seqlist.c—接口函数的实现模块 seqlist.h—接口函数声明 顺序表的基本概念 顺序表是在计算机内存中通常以数组形式存储的线性表&#xff0c;线性表是n个具有相同特性的数据元…

R语言绘制PCA双标图、碎石图、变量载荷图和变量贡献图

1、原论文数据双标图 代码&#xff1a; setwd("D:/Desktop/0000/R") #更改路径#导入数据 df <- read.table("Input data.csv", header T, sep ",")# ----------------------------------- #所需的包: packages <- c("ggplot2&quo…

电视访问群晖共享文件失败的设置方式,降低协议版本

控制面板-文件服务-SMB-高级设置&#xff0c;常规及其他里面配置即可。

【红外图像增强】基于引力和侧向抑制网络的红外图像增强模型(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

计算机视觉: 三维物体生成

三维物体生成与编辑 论文地址: Controllable Mesh Generation Through Sparse Latent Point Diffusion Models 背景 数据是目前数字化和AI领域最宝贵的财富之一&#xff0c;但是对于目前的开发者来说&#xff0c;收集数据都意味着极大的成本。所以建立一个高效的生成模型能极…

Linux学习之Redis使用

搭建Redis服务器 在主机redis64运行redis服务 #安装redis服务 [rootredis64 ~]# yum install -y redis # 启动redis服务并开机启动 [rootredis64 ~]# systemctl enable redis --now # 查看redis端口 [rootredis64 ~]# ss -tnlp | grep redis-server LISTEN 0 128 …

PythonWeb服务器(HTTP协议)

一、HTTP协议与实现原理 HTTP&#xff08;Hypertext Transfer Protocol&#xff0c;超文本传输协议&#xff09;是一种用于在网络上传输超文本数据的协议。它是Web应用程序通信的基础&#xff0c;通过客户端和服务器之间的请求和响应来传输数据。在HTTP协议中连接客户与服务器的…

网工基础知识——以太网

1972年Bob Metcalfe“以太网之父”被Xerox雇佣为网络专家&#xff0c;Bob Metcalfe 来到Xerox公司的Palo Alto研究中心&#xff08;PARC&#xff09;的第一个任务是把Palo Alto的计算机连接到ARPANET&#xff08;Internet的前身&#xff09;上。1972年底Bob Metcalfe以ALOHA系统…

Day 02 python学习笔记

python运算符 算术运算符 混合运算的优先级&#xff1a; () 高于 ** * / // % 高于 - 赋值运算符 - * / ** a 1 > a 3 > a a 3 其余同理 注意&#xff1a; python没有自增自减 &#xff08;a a a-- --a&#xff09;…

力扣刷题-链表-设计链表

题意&#xff1a; 在链表类中实现这些功能&#xff1a; get(index)&#xff1a;获取链表中第 index 个节点的值。如果索引无效&#xff0c;则返回-1。 addAtHead(val)&#xff1a;在链表的第一个元素之前添加一个值为 val 的节点。插入后&#xff0c;新节点将成为链表的第一个节…

华为OD机考算法题:分积木

目录 题目部分 解读与分析 代码实现 题目部分 题目分积木难度难题目说明Solo和koko是两兄弟&#xff0c;妈妈给了他们一大堆积木&#xff0c;每块积木上都有自己的重量。现在他们想要将这些积木分成两堆。哥哥Solo负责分配&#xff0c;弟弟koko要求两个人获得的积木总重量“…

ImportError: Java package ‘edu‘ not found, requested by alias ‘edu‘

参考issue&#xff1a; https://github.com/ncbi-nlp/NegBio/issues/44 我目前的解决办法 pip uninstall jpype1 -y可以成功运行。

Ubuntu修改静态IP、网关和DNS的方法总结

Ubuntu修改静态IP、网关和DNS的方法总结 ubuntu系统&#xff08;其他debian的衍生版本好像也可以&#xff09;修改静态IP有以下几种方法。&#xff08;搜索总结&#xff0c;可能也不太对&#xff09; /etc/netplan (use) Ubuntu 18.04开始可以使用netplan配置网络&#xff0…

二十五、MySQL事务的四大特性和常见的并发事务问题

1、事务的四大特性 2、常见的并发事务问题 &#xff08;1&#xff09;并发事务问题分类&#xff1a; &#xff08;2&#xff09;脏读&#xff1a; 一个事务正在对一条记录做修改&#xff0c;在这个事务完成并提交前&#xff0c;这条记录的数据就处于不一致的状态&#xff1b;…

HTTP代理反爬虫技术详解

HTTP代理是一种网络技术&#xff0c;它可以将客户端的请求转发到目标服务器&#xff0c;并将服务器的响应返回给客户端。在网络安全领域中&#xff0c;HTTP代理经常被用来反爬虫&#xff0c;以保护网站的正常运营。 HTTP代理反爬虫的原理是通过限制访问者的IP地址、访问频率、U…