又快到了写论文的时候了,有小伙伴论文采用了问卷调查方法,但不是特别清楚具体的问卷设计和数据分析流程。
今天就和大家说说整个流程:怎么设计一份合格的问卷以及怎么对问卷数据进行分析?
一、问卷设计步骤
如果是学术研究,建议论文问卷设计中多使用量表,这样会让问卷更加专业,量表可以匹配非常多的研究方法,可以建立模型,也能深入挖掘数据信息。
01确定研究主题
问卷设计最开始要确定研究主题,可以阅读相关文献以及类似问卷研究,对要发放问卷的对象做访谈。
然后根据已经了解的材料,形成一个假设,从假设中确定一个研究主题,之后的问卷设计就要围绕这个假设和确定的主题中的变量来进行。例如最终确定要研究“消费者网购情况和社交媒体使用的关系情况”。
02具体设计题目
确定了研究主题,可以遵循一个叫做“关键词法”的思路去具体设计我们的问卷。
从确定的研究主题中,可以提取出关键词,如上面的主题中,核心想研究的点包括两个关键词:☑ 网购☑ 社交媒体
有了这两个关键词后,接着需要做的是细分:网购可以用一些什么样的问题表示。社交媒体应该用一些什么样的问题表示。
通常情况下,一个关键词下属对应有4~7个题即可,不需要太多。那么2个关键词就可以设计8~14个题。8~14个题比较少,可以将每一个关键词再细拆,一个关键词常见的拆分可以分成两类:☑ 基本行为☑ 基本态度
所以网购就可以再拆分成网购行为和网购态度两个方面。类似的,社交媒体也可以拆分成社交媒体使用情况和社交媒体态度情况两个方面。在这样的思路前提下,将一个研究题目分拆成4~7个关键词,每个关键词4~7个题,整个研究就会充实饱满。如果最终拆分成5个关键词,每个关键词对应着6个题目,则有30个题目。
接着需要加入一些共性的问卷题目,比如性别,年龄,学历,收入,消费等基础信息,一份比较完整的问卷就已经完成。
03问卷试发放和修改
问卷初稿设计好后,不能直接将它用于正式调查,需要对问卷初稿进行试用和修改。
问卷的试用就是通过预调查来检验问卷的质量是否符合调查研究的要求、是否能够使被调查者愿意并方便地回答各项问题、是否能够搜集到真实、准确的数据。
预调查阶段的样本一般采用小样本,根据经验,预调查的样本量以题项数量的5至10倍为宜。研究者也可以视经费条件,确定预调查的样本量。
预调查回收回来的问卷,针对问卷初稿所存在的问题,要分析原因并逐一加以修改。问卷修改的内容可能包括:
-
问卷的说明词
-
填答问卷的要求与逐一事项
-
问题的表述方式
-
问题的回答方式
-
问题的编排顺序
-
问卷的整体结构与逻辑
-
问卷的排版格式
问卷修改后就可以正式发放了。
二、问卷数据分析步骤
回收到的问卷数据,可以直接上传到SPSSAU进行分析,对量表问卷,我们可以按照以下顺序进行分析:
01样本背景分析
样本背景信息主要是是指人口统计学变量,包括性别、年龄、学历、职业等。对这些题目可以进行基本的频数分析。
02样本特征行为分析
样本基本行为特征是指问卷中有关样本行为,或者认知态度的相关问题,比如研究手机依赖的现状及影响因素,那应该对应有“手机使用时长、手机使用频率”等题目。这些题目也可使用频数分析进行汇总,进一步了解清楚样本特征情况。
此部分多以选择题为主,如果题目中有多选题,则可使用SPSSAU[问卷研究]中的[多选题]进行分析。
03指标归类分析
在完成样本背景信息,样本基本行为特征题目的分析后,接下来即可开始分析核心研究变量。
该部分为核心内容,通常是李克特量表题。针对指标归类分析,如果有量表题具体应该分为多少个维度,并不完全确定,此时可使用因子分析进行浓缩,得出几个维度(因子),并且找到维度与题项的对应关系情况,同时此步也可以检验量表的效度。
04信度分析
数据是否可靠,是否有信度是最基础的,一般放在样本基本背景特征情况分析之后进行。信度的检验可以通过不同的方法来实现。
首先,可通过SPSSAU[问卷研究]—[信度]计算Cronbachα系数,来测量题目间的内部一致程度。
克隆巴赫信度系数Cronbachα系数值:
-
Cronbach α≥0.8,则该测验或量表的信度非常好;
-
Cronbach α≥0.7,则说明信度较好;
-
Cronbach α≥0.6,则该量表应进行修订,但仍不失其价值;
-
Cronbach α<0.6,说明信度不佳,此时可考虑重新设计题项。
其次,还可计算重测信度。重测信度即用同一问卷在不同时间,对同一对象进行重复测量,然后通过SPSSAU[通用方法]—[相关]得到相关系数即一致性程度。相关系数在0~1之间,越接近1,说明重测信度越高。
评分者信度,也是一种检测信度的方式。是指测量多个评分者给同一批人答卷进行评分的一致性程度。如果评分者是两个人,则可以用pearson相关([问卷研究—相关]);如果评分者有多个人,可用评分等级作为数据,用Kendall协调系数([实验/医学研究—Kendall协调系数])。
05效度分析
效度是指一个测验或量表实际能测出的所要测量内容的程度,即测验达到测验目的的程度。对量表效度进行检验,可了解量表设计的是否合理。
结构效度指测量题项与测量维度之间的对应关系。测量方法有两种,一种是探索性因子分析,另外一种是验证性因子分析。其中,探索性因子分析是当前使用最为广泛的结构效度测量方法。
通常效度检验(因子分析)输出结果包括:KMO检验和Bartlett的检验结果、方差解释率表格、因子载荷系数表格、碎石图等。
①判断是否适合用因子分析检验效度
首先使用KMO 和 Bartlett 检验进行效度。
通常KMO值的判断标准为0.6。大于0.6说明效度较好,反之,说明不适合效度欠佳。
②判断提取因子个数
如果需要进一步考虑维度与分析项的对应关系,则需要根据方差解释率表格选择输出因子个数。多数情况下,我们在分析时已经带着主观预期,希望各题对应什么维度,此时可以直接设置对应的因子个数。
如果研究人员并没有预设维度。而选择默认选项,SPSSAU默认以特征根大于1作为标准。
同时可结合碎石图辅助判断因子提取个数。当折线由陡峭突然变得平稳时,陡峭到平稳对应的因子个数即为参考提取因子个数。
实际研究中更多以专业知识,结合因子与研究项对应关系情况,综合权衡判断得出因子个数。
③判断因子与题项对应关系
上面提到确定因子提取个数除了要考虑以上指标,更重要的是结合因子与研究项对应关系情况判断。
因子载荷系数表,正是反映因子和研究项对应关系情况。
如果出现因子分析结果与预期结果不一致,这种情况是非常常见的。对于不理想的题项可以移出该项,再次分析,直至所有分析项与因子对应关系良好,此时即可说明效度良好。
06研究变量描述分析
数据可靠,并且研究量表有效之后,接着需要对具体维度(量表题项等)进行描述分析,研究样本人群对于量表项的基本态度情况。
可通过计算变量的平均值来分析,有时利用折线图来展示变量的平均值排序情况。
同时,由于一个维度通常由多个标题项共同构成,如果想将多个标题项概括成一个整体进行分析,此时需要使用SPSSAU中“生成变量”的“平均值”功能。
操作途径:SPSSAU[数据处理]-[生成变量]-[平均值]
07变量相关关系分析
上一部分对研究变量进行描述分析后,接着研究两两变量之间的相互关系,即通过相关分析去研究变量之间的关系情况,包括是否有关系和关系紧密程度。
首先看Y与X是否有显著关系,P值用于判断相关系数是否有统计学意义,P<0.05即说明变量间有相关关系,P值并不代表相关关系的强弱。星号代表P值。一个星号代表P<0.05,两个星号代表P<0.01。如果没有星号,则说明P值>0.05。接着分析相关关系为正向或负向,通过相关系数大小可以说明关系的紧密程度,相关系数越大,说明相关程度越紧密。
08研究假设验证分析
在数据有着相关的前提之下,再研究回归影响关系才具有意义。因而回归分析需要放在相关分析之后。并且通常情况下使用回归分析去验证假设。
首先对模型情况进行分析,包括模型拟合情况(R²),是否通过F检验。回归模型通过F检验,说明至少一个自变量会对因变量有影响关系。接着,分析X的显著性,如果呈现出显著性,则说明X对Y有影响关系。如果不显著,则应剔除该变量。然后,判断X对Y的影响关系方向及影响程度。结合回归系数B值,对比分析X对Y的影响程度。B值为正数则说明X对Y有正向影响,为负则说明有负向影响。最后对分析进行总结。
09差异分析
有可能还需要对比不同人群,比如性别,年龄等不同群体,他们对于量表题项的态度差异情况,因而一般可使用方差分析,或者t检验等进行分析。如果说想研究不同背景人群(比如性别,年龄)对于样本行为上(定类数据)的差异性,建议可使用交叉卡方分析等,涉及多选题的交叉分析等,对应选择[问卷研究]里的[单选-多选]方法即可。