SPSS(十二)SPSS对应分析(图文+数据集)

SPSS(十二)SPSS对应分析(图文+数据集)

对应分析的介绍

对应分析其实是对分类变量进行信息浓缩的方法,之前的主成分分析/因子分析针对的是连续型的变量

分析分类变量间关系时

  • 卡方检验只能给出总体有无关联的结论,但不能进行精细分析,在变量类别极多时于事无补
  • Logistic模型在多分类时我们可以使用哑变量,但是例如56各民族,我们要弄55个哑变量,自变量还要考虑交互项,几百个参数,过于笨拙

解决办法

  • 精细建模:对数线性模型

对数线性模型在探究分类变量与分类变量之间的关系时非常强大,不过太过复杂,不好解释

  • 直观展示:对应分析(对于对数线性模型我们可以偷点懒,不要那么精细,让其好解释一点)

 

对应分析的特点

  • 是多维图示分析技术之一,结果直观、简单
  • 与因子分析有关,等价于分类资料的典型相关分析
  • 用于展示两个/多个分类变量各类间的关系(比如:高收入、黑人、男性倾向于反对开战)
  • 研究较多分类变量间关系时较佳
  • 各个变量的类别较多时较佳(均为四类以上)

 

对应分析的实质(理论很复杂,但是结果很明了简单)

  • 就是对列联表中的数据信息进行浓缩,然后以易于阅读的图形方式呈现出来
  • 以默认的卡方测量方式为例,首先以列联表为分析基础,计算基于H0假设的标化单元格残差

  • 将每行看成是一条记录,基于列变量相关系数阵进行因子分析,计算出列变量各类的负荷值
  • 将每列看成是一条记录,基于行变量相关系数阵进行因子分析,计算出行变量各类的负荷值

一句话来说就是计算出残差,残差做因子分析提取主成分之后绘图(散点图)表示

 

对应分析的局限性

  • 不能进行变量间相关关系的检验仍然只是一种统计描述方法
  • 解决方案的所需维度需要研究者决定
  • 对极端值敏感对于小样本不推荐使用

 

案例:头发与颜色间存在何种关联

数据集如下

98	1	1
343	1	2
326	1	3
688	1	4
48	2	1
84	2	2
38	2	3
116	2	4
403	3	1
909	3	2
241	3	3
584	3	4
681	4	1
412	4	2
110	4	3
188	4	4
85	5	1
26	5	2
3	5	3
4	5	4

第一列的数据是加权的

我们先使用百分比堆积图看会比较直观一些

我们的对应分析就是比上面那个更加直观的表示出来,对应分析只是一种统计描述的方法,我们要先进行卡方检验

结果如下 :

Pearson卡方检验Sig.<0.05证明两个变量并不是没有关联的,并不是完全独立的

对应分析建模

定义其范围

 

结果解读
摘要:就是提取了几个维度,最多可以提取三个维度,我们看到其只取了两个维度;摘要里面有卡方检验,其实我们前面单独做卡方检验没有必要,和前面我们自己手动做卡方检验结果一致;比较有用的是惯量比例里面的解释,指的是这个信息携带了百分之多少的原始信息量

概述行、列点:在两个维度坐标空间中计算出其对应的坐标

行和列点:这个就是对应分析图,也就是我们最终结果呈现

 

为了方便结果查看,我们添加X/Y参考线,位置都为0

(0,0)代表无任何倾向,无任何关联

得到这张图

 

对应分析图的阅读

每个维度可能代表了一种特征

实际上就是一个提取出的主成分,但由于分类变量的信息较少,可能找不到合理的解释

1.考察同一变量的区分度:如果同一变量不同类别在某个方向上靠得较近,则说明这些类别在该维度上区别不大。

2.考察不同变量的类别联系:一般而言,落在从图形原点(0,0)处出发相同方位上大致相同区域内的不同变量的分类点彼此有联系。散点间距离越近,说明关联倾向越明显;散点离原点越远,也说明关联倾向越明显。

 

(注意:远点周围的点不要去解释,因为原点代表无任何倾向,无任何关联)

对应分析图的正确解释

  • 错误的解释:金色头发的儿童中蓝色、浅色眼睛者居多
  • 正确的解释:相对于平均水平而言,金色头发的儿童中蓝色、浅色眼睛的比例要高一些,也就是高于其他颜色头发的儿童

 

 

对应分析补充扩展

假如某一个变量的类别数据量太少我们不想纳入模型分析,可以设置其为补充型,选为补充型之后类别不会纳入模型,但是会显示结果

变量下面的框框,定义范围,类别约束里面选类别为补充型

 

假如我们想把两个类别当成一个类别来观察,还是在刚才那里设置,设置为类别必须相等

 

对应分析中应注意的问题

分析目的:重在观察行、列变量间的联系

数据类型:无序分类较佳,如果均为有序分类,且变量较多时,采用多维偏好分析更合适

样本量:对极端值敏感,分析时有必要去除频数过少的单元格,对于小样本不推荐使用

变量间关联:不能将对应分析作为筛选相关变量的方法,变量纳入前最好先做卡方检验

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/54335.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何用SPSS进行数据分析?

1.什么是SPSS SPSS是社会统计科学软件包的简称&#xff0c; 其官方全称为IBM SPSS Statistics。SPSS软件包最初由SPSS Inc.于1968年推出&#xff0c;于2009年被IBM收购&#xff0c;主要运用于各领域数据的管理和统计分析。作为世界社会科学数据分析的标准&#xff0c;SPSS操作…

数据分析中的Excel、R、Python、SPSS、SAS和SQL

作为一直想入门数据分析的童鞋们来说&#xff0c;如何选定一门面向数据分析的编程语言或工具呢&#xff1f;注意是数据分析&#xff0c;而不是大数据哦&#xff0c;数据分析是基础了。 数据分析的工具千万种&#xff0c;综合起来万变不离其宗。无非是数据获取、数据存储、数据管…

SPSS数据分析-交叉表分析

交叉表(交叉列联表) 分析法是一种以表格的形式同时描述两个或多个变量的联合分布及其结果的统计分析方法&#xff0c;此表格反映了这些只有有限分类或取值的离散变量的联合分布。 当交叉表只涉及两个定类变量时&#xff0c;交叉表又叫做相依表。 交叉列联表分析易于理解&#x…

用SPSS做数据分析(1)

写在前面: 爬虫今天停更一天,今天是周六,今天要把最近网课学习SPSS课程做个总结和回顾,明天继续更新爬虫的内容,今天这篇文章主要是SPSS中的数据管理,一些关于数据的简单操作,是属于SPSS中比较基础的内容,希望看完博客能动手亲自实践一下,会有奇效 文章目录 写在前面:SPSS数据…

spss分析方法-T检验

t检验&#xff0c;也称student t检验&#xff08;Students t test&#xff09;&#xff0c;主要用于样本含量较小&#xff08;例如n < 30&#xff09;&#xff0c;总体标准差σ未知的正态分布。t检验是用t分布理论来推论差异发生的概率&#xff0c;从而比较两个平均数的差异…

用SPSS进行多变量数据分析

用SPSS进行多变量数据分析 1.将所给的数据输入SPSS 22.0中文版。分别设置变量为温度&#xff0c;体重1、2、3、4&#xff1b;体重&#xff0c;温度5、10、15、20、30。 2.用SPSS进行作图&#xff08;过程略&#xff09;。 3.对数据进行多因素变量分析&#xff0c;具体操作如…

利用SPSS做数据分析①(了解SPSS)

话不多说&#xff0c;上才艺&#xff0c;BGM&#xff0c;BGM&#xff0c;BGMBGM。。。哈哈哈哈 不闹了&#xff0c;接下来让我们一起认识一个非常好用的数据分析工具&#xff1a;SPSS 1、SPSS是什么&#xff1f; SPSS是广大统计爱好者和数据分析师最熟悉的名字&#xff0c;它…

SPSS:数据分析

目录 1、数据采集 2、数据是否服从正态分布 3、T检验&#xff08;T Test&#xff09; 4、方差分析&#xff08;ANOVA&#xff09; 5、卡方检验&#xff08;Chi-square Test&#xff09; 6、灰色关联度分析&#xff08;Grey Relation Analysis&#xff0c;GRA&#xff09;…

SPSS数据分析

第一题 表1 居民健康状况调查情况 编号 身高 &#xff08;cm&#xff09; 体重 &#xff08;kg&#xff09; 代谢综合征 性别 胆固醇 &#xff08;mmol/L&#xff09; 1 173.0 87.5 0 0 4.17 2 168.0 74.5 1 0 5.43 3 159.5 60.2 0 0 5.15 4 175.2 …

明着呼吁暂停,暗着囤积GPU,马斯克暗度陈仓玩得溜

众所周知&#xff0c;此前马斯克纠集了上千名科技工作者对生成式人工智能的深度训练表示了质疑&#xff0c;呼吁暂停继续对深度人工智能的训练&#xff0c;哪怕先暂停六个月。呼吁的尘埃还没有彻底落地&#xff0c;就传出了马斯克已经悄悄地囤积了上万枚GPU&#xff0c;构建自己…

小红薯笔记/帖子采集工具

小红书【笔记/帖子】采集工具 链接&#xff1a; http://106.53.68.168:9920/xhs-keyword-spider 规则及操作 &#xff08;1&#xff09;规则&#xff1a; 按照关键词抓取规则&#xff1a;标题中或者正文内容中包含该关键词都能被抓取下来。多种搜索模式可选&#xff0c;分别…

Python实现微信自动发送消息

目标&#xff1a; ①Python定时发送微信消息&#xff1b; ②Python实时发送微信消息。 使用键位编码win32api、win32con 或者send_keys实现发送微信消息。 首先以win32api、win32con为例&#xff1a; """ 实现定时自动发送消息 """import tim…

2020年中国数字阅读产品营销洞察报告

全民阅读七入政府工作报告&#xff0c;数字阅读行业乘政策东风。数字阅读行业市场规模2020年预计突破200亿&#xff0c;彰显数字阅读平台具有较高的媒体价值。同时&#xff0c;数字阅读用户规模突破4亿&#xff0c;用户使用时长波动式增长&#xff0c;对平台黏性高。 数字阅读…

数据驱动的互联网营销和运营专用名词速览

来源&#xff1a;网站分析在中国 数据猿官网 | www.datayuan.cn 今日头条丨一点资讯丨腾讯丨搜狐丨网易丨凤凰丨阿里UC大鱼丨新浪微博丨新浪看点丨百度百家丨博客中国丨趣头条丨腾讯云云社区 最基本的名词&#xff08;14个&#xff09; Ads&#xff1a;就是广告&#xff08;名词…

Day06-数据分析在各行各业的应用与数据思维

数据分析在各行各业的应用 数据分析在各行各业的应用 计算机、金融、财务会计、医药专业、艺术专业、语言类专业、法律专业、设计、电商 相信很多人都听到过不少次数据分析这一词&#xff0c;而数据分析这个次近几年来随着互联网的快速发展&#xff0c;成为商业世界中的流行语…

广告营销用户点击预测分析

广告营销用户点击预测分析 零、数据集以及数据集简介以及任务分析一、数据预处理1、加载检查数据&#xff08;1&#xff09;特殊特征&#xff08;2&#xff09;特殊特征的处理&#xff08;3&#xff09;特殊特征处理后生成的新特征 2、数据类型与缺失值处理&#xff08;1&#…

雅思阅读真经总纲_雅思天团集训课流程介绍

欢迎宝宝们来到我们为期7天的雅思天团集训营&#xff0c;下面来给大家介绍一下这7天你将如何度过~ 课程简介及课前准备 本次课程时间为7天&#xff0c;第一天需要同学们提早到场进行签到&#xff0c;最后一天还给同学们安排了有关留学的讲座&#xff0c;为大家介绍2021年留学政…

全渠道数字化营销平台

01 互联网行业背景 在数字经济时代&#xff0c;用户面临的消费场景和沟通场景都更加碎片化。因此&#xff0c;企业急需一款数字化营销工具打造属于自己的用户数据池&#xff0c;深入整合、挖掘现有数据&#xff0c;以更高效、更个性化的方式进行营销活动&#xff0c;实现与用户…

数字化营销服务-如何进行数字化营销?

1、数字营销服务&#xff1a;如何进行数字营销&#xff1f; 第二点是数字营销对比电视、广播等传统营销方式的解读&#xff1b; 第三点是数字营销带来的红利的解读。很多人认为数字营销是一种低成本获取流量的方式&#xff0c;但这其实是一种偏见&#xff1b; (2)尽可能的数…

【PythonBA】商业分析:Business Analytics 的理解

猛戳订阅! 👉 《一起玩蛇》🐍 📜 本章目录: Ⅰ. BA 的基础概念 0x00 什么是商业分析(Business Analytics) 0x01 Explain 和 Predict