应用统计spss分析报
告
TYYGROUP system office room 【TYYUA16H-TYY-TYYYUA8Q8-
学生姓名: 肖浩鑫 学号:
一、实验项目名称:实验报告(三) 二、实验目的和要求
(一)变量间关系的度量:包括绘制散点图,相关系数计算及显着性检验; (二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显着性检验,利用回归方程进行估计和预测;
(三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显着性检验等,多重共线性问题与自变量选择,哑变量回归;
三、实验内容
1. 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:
企业编号 产量(台) 1 2 3 4 5 6 40 42 50 55 65 78 生产费用(万元) 130 150 155 140 150 154 企业编号 产量(台) 7 8 9 10 11 12 84 100 116 125 130 140 生产费用(万元) 165 170 167 180 175 185 (1)绘制产量与生产费用的散点图,判断二者之间的关系形态。 (2)计算产量与生产费用之间的线性相关系数,并对相关系数的显着性进行检验(),并说明二者之间的关系强度。
2. 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 地区 北京 辽宁 上海 江西 河南 贵州 陕西 人均GDP(元) 22460 11226 34547 4851 5444 2662 4549 人均消费水平(元) 7326 4490 11546 2396 2208 1608 2035 (1)绘制散点图,并计算相关系数,说明二者之间的关系。 (2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
(3)计算判定系数和估计标准误差,并解释其意义。 (4)检验回归方程线性关系的显着性()
(5)如果某地区的人均GDP为5000元,预测其人均消费水平。
(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
3. 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,数据如下: 航空公司编号 1 2 3 4 5 6 7 8 9 10 航班正点率(%) 投诉次数(次) 21 58 85 68 74 93 72 122 18 125 (1)用航班正点率作自变量,顾客投诉次数作因变量,估计回归方程,并解释回归系数的意义。
(2)检验回归系数的显着性()。
(3)如果航班正点率为80%,估计顾客的投诉次数。
4. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果: 方差分析表 变差来源 回归 残差 总计 参数估计表 Intercept Coefficients 标准误差 t Stat P-value df 11 SS MS — F — — Significance F — — X Variable 1 (1)完成上面的方差分析表。 (2)汽车销售量的变差中有多少是由于广告费用的变动引起的? (3)销售量与广告费用之间的相关系数是多少?
(4)写出估计的回归方程并解释回归系数的实际意义。 (5)检验线性关系的显着性(a=)。
5. 随机抽取7家超市,得到其广告费支出和销售额数据如下
超市 A B C D E F G 广告费支出/万元 1 2 4 6 10 14 20 销售额/万元 19 32 44 40 52 53 54 (1) 用广告费支出作自变量,销售额为因变量,求出估计的回归方程。
(2) 检验广告费支出与销售额之间的线性关系是否显着(a=)。 (3) 绘制关于的残差图,你觉得关于误差项的假定被满足了吗?
(4) 你是选用这个模型,还是另寻找一个该更好的模型?
6. 一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近8个月的销售额与广告费用数据
月销售收入y(万元) 96 90 95 92 95 94 94 94 电视广告费用(万元) 报纸广告费用(万元) (1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。
(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程,并说明回归系数的意义。
(3)上述(1)和(2)所建立的估计方程,电视广告费用的系数是否相同?对回归系数分别解释。
(4)根据(1)和(2)所建立的估计方程,说明它们的R2的意义。 7. 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下
收获量y (kg) 2250 3450 4500 6750 7200 降雨量x1 (mm) 25 33 45 105 110 温度x2 (6 8 10 13 14 )
7500 8250 115 120 16 17 建立早稻收获量对春季降雨量和春季温度的二元线性回归方程,并对回归模型的线性关系和回归系数进行检验(a=),你认为模型中是否存在多重共线性?
8. 一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值
(x1)、房产的评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格作出合理预测。为此,收集了20栋住宅的房地产评估数据如下: (万房地产编号 销售价格y(元/㎡) 地产估价元) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 6890 4850 5550 6200 11650 4500 3800 8300 5900 4750 4050 4000 9700 4550 4090 8000 5600 3700 5000 2240 596 900 950 1000 1800 850 800 2300 810 900 730 800 2000 800 800 1050 400 450 340 150 房产估价(万元) 4497 2780 3144 3959 7283 2732 2986 4775 3912 2935 4012 3168 5851 2345 2089 5625 2086 2261 3595 578 使用面积(㎡) 18730 9280 11260 12650 22140 9120 8990 18030 12040 17250 10800 15290 24550 11510 11730 19600 13440 9880 10760 9620 用SPSS进行逐步回归,确定估计方程,并给出销售价格的预测值及95%的置信区间和预测区间。
9. 为分析某行业中的薪水有无性别歧视,从该行业中随机抽取15名员工,有关的数据如下 月薪y(元) 1548 1629 工龄 性别(1=男,0=女)1 1
1011 1229 1746 1528 1018 1190 1551 985 1610 1432 1215 990 1585 0 0 1 1 0 0 1 0 1 1 0 0 1 进行回归并对结果进行分析。 四、实验数据记录与分析
(基本要求:1.根据题号顺序记录软件输出结果并分析;2.结果可来自对SPSS或Excel进行操作的输出,二选一即可。)
1、(1)
由图可知,产量与生产费用呈正线性相关 (2)
相关性
产量
Pearson 相关性 显着性(双侧) N
生产费用
Pearson 相关性 显着性(双侧) N
产量
1 生产费用
.920 .000 **
12 .920 .000 12 **
12 1 12 **. 在 .01 水平(双侧)上显着相关。
产量与生产费用之间的线性相关系数为,显着相关
2、(1)
相关性
人均GDP
Pearson 相关性 显着性(双侧) N
人均消费水平
Pearson 相关性 显着性(双侧) N
人均GDP
1 人均消费水平
.998 .000 **
7 .998 .000 7 **
7 1 7 **. 在 .01 水平(双侧)上显着相关。
人均GDP与人均消费水平呈正线性相关,相关系数为 (2)
系数 模型 非标准化系数 B 1 (常量) 标准 误差 标准系数 试用版 t Sig. .003 a
人均GDP a. 因变量: 人均消费水平 .309 .008 .998 .000 回归方程:y=+ 含义:人均GDP每增加1元,人均消费就增加元 (3) 模型汇总 模型 R 1 .998 a标准 估计的误R 方 .996 调整 R 方 .996 差 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到% (4)F检验
Anova
模型 1
回归 残差 总计
平方和
df
1 5 6 均方
F
Sig. .000 a
b
a. 预测变量: (常量), 人均GDP。 b. 因变量: 人均消费水平
t检验
系数
模型
非标准化系数 B
1
(常量) 人均GDP
.309 标准 误差
.008 .998 标准系数 试用版
t
Sig. .003 .000 a
b. 因变量: 人均消费水平 (5) y=+*5000= 如果某地区的人均GDP为5000元,预测其人均消费水平为元 (6) 人均GDP为5000元时,人均消费水平95%的置信区间为[,],预测区间为[,]。 3、 5、
3、 (1) 系数 模型 非标准化系数 标准 误B 1 (常量) 航班正点率 a. 因变量: 投诉次数 差 .948 试用版 t Sig. .000 .001 标准系数 a回归方程:y=回归系数的含义:投诉次数每增加一次,航班正点率下降% (2) 由于Sig=< 显着 (3)80= x=74 如果航班正点率为80%,估计顾客的投诉次数为74次 4、(1)
变差来源 df SS 回归 残差 总计 1 MS — F — — Significance F — — 10 11 (2) R^2=SSR/SST==% 汽车销售量的变差中有%是由于广告费用的变动引起的 (3) R=根号R^2= 销售量与广告费用之间的相关系数是 (4) 估计的回归方程:y=+ 回归系数为,表示广告费用每增加一个单位,汽车销售量平均增加个单位 (5) 回归系数的检验:p=<α,回归系数不等于0,显着回归直线的检验:p=<α,回归直线显着 5、(1) 系数 模型 非标准化系数 B 1 (常量) 标准 误差 标准系数 试用版 t Sig. .002 a
广告支出费用 a. 因变量: 销售额 .463 .831 .021 回归方程估计是:y=+ (2)F检验 Anova 模型 1 回归 残差 总计 平方和 df 1 5 6 均方 F Sig. .021 ab a. 预测变量: (常量), 广告支出费用。 b. 因变量: 销售额 Sig=<显着 t检验
系数 模型 非标准化系数 B 1 (常量) 广告支出费用 c. 因变量: 销售额 标准 误差 .463 .831 标准系数 试用版 t Sig. .002 .021 aSig=< 显着
(3)
残差不全相等
(4)应考虑其他模型,可考虑对数曲线模型:
y=b0+b1ln(x)=+(x) 6、(1) 系数 非标准化系数 模型 1 (常量) 电视广告费用 a. 因变量: 月销售收入 B 标准 误差 .478 .808 标准系数 试用版 t Sig. .000 .015 a估计的回归方程:y=+ (2)、 系数 非标准化系数 模型 1 (常量) B 标准 误差 标准系数 试用版 t Sig. .000 a
电视广告费用 报纸广告费用
a. 因变量: 月销售收入
.304 .321
.621
.001 .010
估计的回归方程:y=++
回归系数的意义:报纸广告费用不变的情况下,电视广告费用每增加1万元,月销售额增加万元;电视广告费用不变的情况下,报纸广告费用每增加1万元,月销售额增加万元。
(3)不相同,(1)中表示电视广告费用每增加1万元,月销售额增加万元;(2)中表示电视广告费用每增加1万元,月销售额增加万元
(4)(1)中的含义为电视广告费用对月销售额达到的影响程度,(2)中的含义为电视广告费用和报纸广告费用对月销售额达到的影响程度 7、 系数 非标准化系数 模型 1 (常量) 降雨量 温度 a. 因变量: 收获量 Anova 模型 1 回归 残差 总计 平方和 df 2 4 6 均方 F Sig. .000 aba标准系数 试用版 .415 .590 t Sig. .999 .080 .029 B 标准 误差 a. 预测变量: (常量), 温度, 降雨量。 b. 因变量: 收获量 估计的回归方程:y=++ 回归线性显着
降雨量的回归系数不显着,温度的显着x1与x2的相关系数rx1x2=,存在多重共线性 8、 系数 模型 非标准化系数 B 1 (常量) 房产估计
标准 误差 .140 .916 标准系数 试用版 t Sig. .112 .000 a
2 (常量) 房产估计 使用面积 .961 .163 .200 .066 .651 .336 .020 .985 .000 .024 a. 因变量: 销售价格 估计的回归方程:y=++
销售价格的预测值及95%的置信区间和预测区间: 9、
SUMMARY OUTPUT
回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值
15
SS
MS
F
方差分析
df
回归分析 残差 总计
2 12
Significance
F
14 1021912
Intercept 工龄
性别(1=男,0=女)
Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% 下限 %
上限 %
拟合优度良好,方程线性显着,工龄线性不显着,性别线性显着
因篇幅问题不能全部显示,请点此查看更多更全内容