在做回归预测时需要分析的数据往往是多变量的,那么我们在做多元回归时就需要特别注意了解我们的数据是否能够满足做多元线性回归分析的前提条件. 应用多重线性回归进行统计分析时要求满足哪些条件呢总结起来可用四个词来描述:线性、独立、正态、齐性. (1)自变量与因变量之间存在线性关系 这可以通过绘制”散点图矩阵”进行考察因变量随各自变量值的变化情况.如果因变量Yi 与某个自变量X i 之间呈现出曲线趋势,可尝试通过变量变换予以修正,常用的变量变换方法有对数变换、倒数变换、平方根变换、平方根反正弦变换等. (2)各观测间相互独立 任意两个观测残差的协方差为0 ,也就是要求自变量间不存在多重共线性问题.对于如何处理多重共线性问题,请参考《多元线性回归模型中多重共线性问题处理方法》
(3)残差e 服从正态分布N(0,σ2) .其方差σ2 = var (ei) 反映了回归模型的精度,σ 越小,用所得到回归模型预测y的精确度愈高. (4) e 的大小不随所有变量取值水平的改变而改变,即方差齐性.
在进行stata多元回归前后,需要进行以下两种检验:需要进行多重线性回归方程的适宜性检验以及残差的正态性检验。在进行多元回归之前,需要进行多重线性回归方程的适宜性检验,这是因为多元回归的模型适宜性对结果的准确性非常重要。在残差的正态性检验中,主要是要检验模型的误差项符合正态分布的假设,以保证多元回归的结果的可靠性。在进行多元回归前后还需要进行多方面的分析和检验,例如:解释变量的选择、是否存在多重共线性、是否存在异方差问题以及异常值的排除等,以保证多元回归的结果更为准确和可靠。