在SPSS中有专门的选项的。
例如在回归分析中,线性回归-统计量-有共线性诊断。
多重共线性:自变量间存在近似的线性关系,即某个自变量能近似的用其他自变量的线性函数来描述。
多重共线性的后果:整个回归方程的统计检验Pa,不能纳入方程去掉一两个变量或记录,方程的回归系数值发生剧烈抖动,非常不稳定。
多重共线性的确认:做出自变量间的相关系数矩阵:如果相关系数超过0.9的变量在分析时将会存在共线性问题。
在0.8以上可能会有问题。
但这种方法只能对共线性作初步的判断,并不全面。
容忍度(Tolerance):有 Norusis 提出,即以每个自变量作为应变量对其他自变量进行回归分析时得到的残差比例,大小用1减决定系数来表示。
该指标越小,则说明该自变量被其余变量预测的越精确,共线性可能就越严重。
陈希孺等根据经验得出:如果某个自变量的容忍度小于0.1,则可能存在共线性问题。
方差膨胀因子(Variance inflation factor, VIF): 由Marquardt于1960年提出,实际上就是容忍度的倒数。
特征根(Eigenvalue):该方法实际上就是对自变量进行主成分分析,如果相当多维度的特征根等于0,则可能有比较严重的共线性。
条件指数(Condition Idex):由Stewart等提出,当某些维度的该指标数值大于30时,则能存在共线性。
多重共线性的对策:增大样本量,可部分的解决共线性问题采用多种自变量筛选方法相结合的方式,建立一个最优的逐步回归方程。
从专业的角度加以判断,人为的去除在专业上比较次要的,或者缺失值比较多,测量误差比较大的共线性因子。
进行主成分分析,用提取的因子代替原变量进行回归分析。
进行岭回归分析,它可以有效的解决多重共线性问题。
进行通径分析(Path Analysis),它可以对应自变量间的关系加以精细的刻画。
Spss可以进行比较基本的通径分析,但复杂的模型需要使用SPSS公司的另外一个软件AMOS来进行。