什么事多重共线性
来源:学生作业帮助网 编辑:六六作业网 时间:2024/12/23 04:52:57
什么事多重共线性
什么事多重共线性
什么事多重共线性
所谓的多重共线性是指一些自变量之间存在较强的线性关系.这种情况在实际应用中非常普遍,如研究高血压与年龄、吸烟年限、饮白酒年限等因素的关系,这些自变量通常是相关的,如果这种相关程度非常高,使用最小二乘法建立回归方程就有可能失效,引起下列不良后果:
1、参数估计值的标准误变得很大,从而t值变得很小.
2、回归方程不稳定,增加或减少某几个观察值,估计值可能会发生很大的变化.
3、t检验不准确,误将应保留在方程中的重要变量舍弃.
4、估计值的正负符号与客观实际不一致.
多重共线性的识别:
当出现一下情况时可认为自变量之间存在多重共线性.
1、若两个自变量之间的相关系数接近于1,则可认为模型存在多重共线性.
2、如果决定系数R的平方很大(一般大于0.8),但模型中全部或部分偏回归系数的检验却不显著,那么,此时自变量之间往往存在多重共线性.
3、用自变量之间所构成的回归方程的决定系数R平方进行识别.设自变量为m个,即x1、x2、.、xm,分别以其中的一个对其他所有的自变量进行回归,得m个回归方程,对每个回归方程求其决定系数,在这些决定系数中寻其最大而且接近于1者,比如说R1的平方最大且接近于1,则可以判定自变量x1与其他自变量中的一个或多个线性相关性很强.
4、用方差膨胀因子VIF判别法,方差膨胀因子也称为方差膨胀系数或称方差膨胀值(Variance Inflation),一般当VIF大于10时,可认为模型存在较严重的多重共线性.
多重共线性问题的处理:
1、精简变量法:在自变量中若某个变量对应变量的影响不大且是造成共线性的变量则应删去.
2、逐步回归判别法:用逐步回归法建立回归方程,其中所包含的自变量之间不存在多重共线性.
3、主成分回归法:在多元线性回归中,若自变量之间存在较强的共线性,则得出的回归模型很不稳定,这时,可用少数几个主成分与应变量建立回归方程能避免上述情况的发生.由于主成分之间互不相关,保证了回归方程的稳定性.这种将主成分与多元共线性回归结合使用的方法称为主成分回归法.