1, 主成分分析PCA
我们只要对数化的变量数据:
(1)对数据进行标准化处理:
选择【分析】—【描述统计】—【描述】
添加要标准化的变量,勾选【将标准化值另存为变量(Z)】,再点确定
SPSS软件本身不提供主成份分析,我们的操作是利用因子分析的一些功能完成主成分分析,操作如下:
选择【分析】—【降维】—【因子】
将标准化后的变量选入变量框中:
点击【描述】进入描述框,勾选【系数】,再点击【继续】【确定】
此处多做的KMO检验以及巴特利特球形度检验:
结果如下:
我们的数据在做了KMO检验以及巴特利特球形度检验之后发现:
数据质量一般,但是相关。
相关性分析上只有1个ln宽对数宽变量:
主成分个数提取原则主要包括两个标准,第一个是为主成分对应的特征值大于1的前m个主成分,第二个是前m个主成分累计贡献率大于85%。
对于第一个原则:特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。对于第二个原则,累计贡献率反映了前m个主成分,反映了原来总体样本85%以上的信息,基本反应了原来数据的总体情况。
如果是坚持特征至大于1的原则,那么我们只选择主成分1,
如果坚持累计贡献率大于85%的原则,那么我们还是选择主成分1,
所以我们只选择1个主成分,也就是看ln宽也就是对数宽就可以就够决策
参考:https://blog.csdn.net/My_daily_life/article/details/121333063
2,判别分析
注意:名义自变量必须被重新编码为哑元变量或对比变量!
点击分析,进入分类,选择判别分析
因变量选入分组变量,自变量选入。同时选择变量选择的方法。
编号部分还是要定义范围,最大1,最小0
统计部分暂时选择:
分类部分暂时选择:
保存部分选择:
结果部分:
主要是分类结果:
回到数据表格,可以看到新增的三列。第一列为预测的组别,第2、3为每个个案的分组概率。
参考:https://www.iikx.com/news/statistics/7818.html