一、分类汇总所属模块
分类汇总在SPSSAU中归属于【通用方法】模块。
二、方法概述
分类汇总用于比较不同分类组在某些指标上的表现差异,常见于用户分群、渠道对比、地区对比等场景。它既可以输出各组平均水平,也可以输出按列或按行的百分比分布,便于快速判断结构差异。SPSSAU可在同一入口完成变量放置、参数切换与结果展示,操作非常直接。
三、变量设置规则
1. 变量设置总规则
分类汇总需要设置2类变量:X(分类项)和Y(汇总项)。其中Y为必填,X为可选;若放入X,最多可放2项。
2. 分变量设置说明
(1)X(分类项)
用于分组对比,可不放;最多可放2项,最少0项。放入后系统会按X的类别展开分组结果。
(2)Y(汇总项)
用于被汇总和比较的指标,至少放1项,最多可放200项,为必填变量。
四、参数设置及解释说明
1. 汇总方式参数
分类汇总提供1个核心参数“汇总方式”,可按分析目标切换。
(1)平均值
适合Y为连续型或评分型数据时使用,用于比较不同分类组的总体水平差异。
(2)百分数(按列)
用于查看每一列内部各选项所占比例,适合从“列条件”角度理解结构分布。
(3)百分数(按行)
用于查看每一行内部各选项所占比例,适合从“行条件”角度比较组间构成。
五、分析结果表格及其解读
分类汇总会根据所选汇总方式输出不同结果:平均值模式输出2张核心表;百分数模式(按列或按行)输出3张核心表。
1. 表1:分类汇总分析结果-基础指标(平均值)
该表用于快速对比各分类组与整体的基础水平,包含各组平均值与汇总平均值。
● 平均值:是各组在对应Y指标上的中心水平,用于判断哪一组整体表现更高。判断时直接比较各组数值大小,数值越高代表该指标表现越高。
● 汇总值:是全样本层面的总体水平,用于判断各组相对总体是偏高还是偏低。若某组高于汇总值,说明该组在该指标上高于总体平均表现。
2. 表2:分类汇总分析结果-详细指标
该表用于展开各分类组的分布特征,包含样本量、离散程度、位置指标与分位数指标等。
● n:是各组有效样本量,用于判断结果稳定性。一般样本量越充足,结论越稳健。
● 标准差:用于反映组内波动大小,值越小代表组内更集中,值越大代表差异更分散。
● 中位数:用于观察中间水平,受极端值影响较小;当均值与中位数差异明显时,通常提示分布偏态。
● 四分位间距:用于衡量中间50%样本的离散程度;值越小,说明主流样本更集中。
3. 表3:交叉分析结果
该表在百分数模式下输出,展示频数与比例的合并结果,便于同时看规模和结构。
● 频数:用于判断不同分类下的实际样本规模。频数越大,说明该组合出现得越多。
● 占比:用于判断结构差异。若组间占比差距明显,说明分类结构存在实质差异。
4. 表4:交叉分析结果-数字格式
该表仅保留频数,适合做样本规模核对或二次汇报整理。
● 单元格计数:表示某一分类组合下的样本个数。判断重点是比较组间绝对数量高低。
5. 表5:交叉分析结果-百分比格式
该表仅保留比例,适合关注结构差异而非绝对规模。
● 百分比:用于比较分布构成。判断时优先看同一行或同一列内比例差异是否明显,差异越大说明结构差异越突出。
六、分析结果图表及其解读
当汇总方式选择百分数(按列)或百分数(按行)时,SPSSAU会输出交叉图,用于直观展示不同分类组合的分布差异。
交叉图
交叉图可直接比较不同组别在各选项上的占比高低。若柱形高度差异明显,通常意味着结构差异较大;若柱形高度接近,则说明各组分布相对一致。图表用于快速发现差异位置,最终结论需与表格中的比例结果结合判断。
以上就是SPSSAU分类汇总方法的相关内容,更深入教程可查看SPSSAU帮助手册、教学视频、疑难解惑等资料。