SPSS统计分析
多元线性回归分析方法操作与分析
实验目的:
引入1998~200邨上海市城市人口密度、城市居民人均可支配收入、 五 年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因 素。 实验变量:
以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/ 平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%) 和房屋空置率(%)作为变量。
实验方法:多元线性回归分析法 软件:spss19.0 操作过程: 第一步:导入Excel数据文件
1. open data document ------- open data ------- open;
况 Dm
2. Opening excel data source OK.
第二步:
1.在最上面菜单里面选中 Analyze --------- Regression ------ Linear , Dependent (因变量)选择商品房平均售价,Independents (白变量)选择城市人口 密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率; Method 选择 Stepwise.
进入如下界面:
2. 点击右侧 Statistics ,勾选 Regression Coefficients (回归系数)选 项组中的Estimates ;勾选Residuals (残差)选项组中的Durbin-Watson、
Casewise diagnostics 默认;接着选择 Model fit diagnotics ;点击 Continue.
Collinearity
3. 点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择
DEPENDN回变量)作为横轴变量;勾选选项组中的 Standardized Residual Plots (标准化残差图)中的 Histogram、Normal probability plot ;点 击 Continue.
Linear Rwg r^s.sion; Plots
DEPENDNT Scatter 1 of 1 「EYICILLS 'ZPFiED TZRESID ^DRESIID -ADJPFiED 部 ESID \"SDRESID | Next -Slandardizea Residual Plots |y Histogram I/ Normal probability' plot * I * *ZPRED X: DEPENDbJT Produce all partial plots 4.点击右侧 Save,勾选 Predicted Vaniues (预测值)和 Residuals (残 差)选项组中的 Unstandardized ;点击 Continue.
M Linear Regression: Save Predicted Values 7 Unstsndardized Residuals [^[Unstandardize^ _| Standardized 'J Studentized Dd&ted i Studentized deleted 口 Standardized Adjusted □ S E of mean predicti ons 「Distances □ MahaJ anoMs 'Cool5.点击右侧Options,默认,点击 Continue.
也 Line-ar Reg res^ion; Ootion^ -I密 Stepping Mettiod Criteria ® Use probability of F Enby: .05 O Use Fvalue Removal: 10 Entry: [3,54 Removal: bn l./ Include constantln equation -Missing Values ------------------------------------------ g. Exclude cases, listwise ■ O Exclude cases pairwise 'Replace with mean Continue Cancel Help 6.返回主对话框,单击OK.
输出结果分析:
1. 引入/剔除变量表
Variables Entered/Removed Model 1 Variables Entered 城市人口密度(人/平方公 里) Stepwise (Criteria: Probability-of-F-to-enter <=.050, Probability-of-F-to-2 城市居民人均可支配收入(元) . remove >=.100). Stepwise (Criteria: Probability-of-F-to-enter <=.050, Probability-of-F-to-remove >=.100). a. Dependent Variable:
商品房平均售价(元 /平方米) Variables Removed . Method 该表显示模型最先引入变量城市人口密度 (人/平方公里),第二个引
入模型的是变量城市居民人均可支配收入(元),没有变量被剔除。
2. 模型汇总
Model Summary
c
Std. Error of the Model 1 R 1.000 a 1.000 b R Square 1.000 1.000 Adjusted R Square 1.000 1.000 Estimate Durbin-Watson 35.187 28.351 2.845 2 a. Predictors: (Constant), b. Predictors: (Constant), c. Dependent Variable:
城市人口密度 (人/平方公里)
城市人口密度 (人/平方公里),城市居民人均可支配收入 (元)
商品房平均售价(元 /平方米)
该表显示模型的拟合情况。从表中可以看出,模型的复相关系数( R) 为 1.000,判定系数(RSquare)为 1.000,调整判定系数(Adjusted RSquare) 为 1.000,估计值的标准误差(Std. Error of the Estimate )为 28.351 , Durbin-Watson检验统计量为2.845,当D观2时说明残差。 3. 方差分析表
ANOVA Model 1 Regression Residual Total 2 Regression Residual Sum of Squares 38305583.506 11143.039 38316726.545 38310296.528 30.018 38316726.545 df 1 9 Mean Square 38305583.506 F 30938.620 Sig. .000 a 1238.115 10 2 8 19155148.2 23832.156 .000 b 803.752 Total 10 a. Predictors: (Constant), b. Predictors: (Constant), c. Dependent Variable:
城市人口密度 (人/平方公里)
城市人口密度 (人/平方公里),城市居民人均可支配收入 (元)
商品房平均售价(元 /平方米)
该表显示各模型的方差分析结果。从表中可以看出,模型的 F统计量 的观察值为23832.156,概率p值为0.000,在显著性水平为0.05的情形 下,可以认为:商品房平均售价(元/平方米)与城市人口密度(人/平方 公里),和城市居民人均可支配收入(元)之间有线性关系。
4. 回归系数
Coefficients a
Standardiz ed Coefficien ts Unstandardized Coefficients Collinearity Statistics Toleranc e Model 1 B (Constant) 城市人口密度(人/ 平方公里) 1652.246 1.072 Std. Error Beta T 68.454 Sig. VIF 24.137 .006 .000 .000 1.000 1.000 1.000 175.4 2 (Constant) 城市人口密度(人/ 平方公里) 1555.506 1.020 44.432 .022 .951 35.009 46.302 .000 .000 .050 20.126 城市居民人均可支配 收入(元) a. Dependent Variable:
.017 .007 .050 2.422 .042 .050 20.126 商品房平均售价(元/平方米) 该表为多元线性回归的系数列表。 表中显示了模型的偏回归系数(B)、 标准误差(Std. Error )、常数(Constant)、标准化偏回归系数(Beta)、 回归系数检验的t统计量观测值和相应的概率p值(Sig.)、共线性统计 量显示了变量的容差(Tolerance )和方差膨胀因子(VIF)。
令XI表示城市人口密度(人/平方公里),X2表示城市居民人均可支配收 入(元),根据模型建立的多元多元线性回归方程为:
y=1555.506+1.020 X 1 +0.017X 2
方程中的常数项为1555.506,偏回归系数b1为1.020 , b2为0.017, 经T检验,b1和b2的概率p值分别为0.000和0.042 ,按照给定的显著性 水平0.10的情形下,均有显著性意义。
根据容差发现,白变量间共线性问题严重; VIF值为20.126,也可以 说明共线性较明显。这可能是由于样本容量太小造成的。
5. 模型外的变量
Excluded Variables
c
Model
Beta In t Sig. Partial Collinearity Statistics Correlation Toleranc e .050 VIF 20.126 Minimum Tolerance .050 1 城市居民人均可支配 收入(元) 五年以上平均年贷款 利率(%) 房屋空置率(%) .050 a 2.422 .042 .650 -.001 a -.241 .815 -.085 .999 1.001 .999 .004 a .002 b .596 .391 .568 .708 .206 .146 .928 .913 1.078 1.096 .928 .045 2 五年以上平均年贷款 利率(%) 房屋空置率(%) .002 b .452 .665 .168 .914 1.094 .049 a. Predictors in the Model: (Constant), b. Predictors in the Model: (Constant), c. Dependent Variable:
城市人口密度 (人/平方公里)
城市人口密度 (人/平方公里),城市居民人均可支配收入
(元)
商品房平均售价(元 /平方米)
该表显示的是回归方程外的各模型变量的有关统计量, 可见模型方程 外的各变量偏回归系数经重检验,概率P值均大于0.10 ,故不能引入方程。
6. 共线性诊断
Collinearity Diagnostics Variance Proportions 城市人口密度 Model 1 Dimension 1 2 2 城市居民人均可 Eigenvalue 1.8 .102 2.1 .106 .003 Condition Index 1.000 4.319 1.000 5.213 30.736 (Constant) .05 .95 .00 .21 .78 (人/平方公里) 支配收入(元) .05 .95 .00 .03 .97 .00 .00 1.00 1 2 3 a. Dependent Variable:
商品房平均售价(元/平方米) 该表是多重共线性检验的特征值以及条件指数。 对于第二个模型,最 大特征值为2.1 ,其余依次快速减小。第三列的各个条件指数,可以看 出有多重共线性。
7. 残差统计量
Residuals Statistics Minimum Predicted Value 3394.71 Maximum 8382.83 Mean 5465. Std. Deviation 1957.302 N 11 Residual -47.035 40.271 .000 25.357 11 Std. Predicted Value -1.058 1.490 .000 1.000 11 Std. Residual -1.659 1.420 .000 .4 11 a. Dependent Variable:
商品房平均售价(元 /平方米) 该表为回归模型的残差统计量,标准化残差(
对值最大为1.659,没有超过默认值3,不能发现奇异值。 Std. Residual )的绝
8. 回归标准化残差的直方图
Histogram
该图为回归标准化残差的直方图,正态曲线也被显示在直方图上,用 以判断标准化残差是否呈正态分布。 但是由于样本数只有11个,所以只能 大概判断其呈正态分布。
9. 回归标准化的正态P-P图
Norma II P-P Plot of Regression Standardized Residual
旦该图回归标准化的正态P-P图,该图给出了观测值的残差分布与假设 的正态分布的比较,由图可知标准化残差散点分布靠近直线,因而可判断 标准化残差呈正态分布。
10. 因变量与回归标准化预测值的散点图
Scatterplot
•叩岂Mont Vari北厚 商乱房平均房价(元/平方米)
15-
@
Word刘档籍料
3000
0dE2up4t:«dMLy 』Observed Cum Prob
Dependent Variable:商曷房平均督价(川\"平方米)
p^EPEd P®N_ p」恒Q
Q
倨
O
0.0
uo'55峭」0
4)6-
9\"«££
,「「「「「
4000
SDOO
6000
7000
6000
9000
商品房平均俾价(元,平方来)
该图显示的是因变量与回归标准化预测值的散点图,其中 DEPENDENT x轴变量,
:
两y轴变量。由图可见,两变量呈直线趋势。
为*ZPRE附件:原始数据年傍 1996 1999 2000 2001 2002 或。3 商品房平均售价( 无平方米) 3d01 3422 3SS5 3866 4134 S11I8 5855 S042 7196 8361 8362 械市人口密度人平 城市居需人均可夜 五年以上平均年贷 方公里 配收入元 款利率 165d 1672 1757 2050 2279 326U 3913 4912 5172 6231 &240 S7TZ 10932 11718 123S3 132S0 1486/ T66B3 1S5 20GGS 23623 8 6.69 6.21 6 21 E.7E 6.76 5 62 6 12 6.45 7.48 6 房屋空萱早 9 37 15.60 23.83 44 24 67.71 制一捎 004 2005 200G 2007
20DS 55 ?8 40.45 14.02 39.31 36.92 26675 自变量散点图:
O- ™ -- 商晶!*告*二置*, 小4900 SQOA EO
lasm iaxn SDQQD h 加
踞「|人门密用〔电罕方公判
曜雨审•泾人并阿屯im 妃司
EK 二厦
由散点图可以看出,可进入分析的变量为城市人口密度、城市居民人均可支配收入。