没有合适的资源?快使用搜索试试~ 我知道了~
资源详情
资源评论
资源推荐
1
相关与回归的定义和区别
相关与回归分析是现代统计学中非常重要的内容,它在自然科学、管理科学和社会经
济领域有着十分广泛的应用。本章从介绍相关分析与回归分析的基本概念与分类入手,以一
元线性回归模型为基础,引出包括多元线性回归分析及非线性回归分析中模型识别、参数估
计、模型检验与预测等内容。
在分析变量之间关系的时,常用的基本模型有两个,一是相关模型(correlation model),
一是回归模型(regression model)。实践中到底使用哪种模型取决于研究者的研究目的和数据
的收集方式和条件。在相关分析中,变量
X
和
Y
都被视为随机变量,
),( YX
服从二元分布;
而在经典回归分析中,变量
x
不是随机变量,它被假定为一般变量,在事先选好的已知值中
取值;变量
Y
是随机变量,在变量
x
的给定取值处有相应的观测值。但自变量 x 固定非随机
极大的限制了回归分析方法在社会、经济等领域的应用,现代回归分析已经把经典回归分析
方法推广到了解释变量也为随机变量的情形。因此,现在 x 变量是否随机已不是相关分析和
回归分析的区分标准。一般地,相关分析的结果比较简单、粗糙,而回归分析的结果更为深
刻、细致。
案例 1-零食的热量
问题:点心食物中的热量和脂肪的关系如何?哪份小吃对你的节食危害最小呢?
食物
热量(卡)
脂肪(克)
玉米饼(15)
110
4
炸薯片(18)
120
6
奶酪味小吃(34)
120
6
炸面饼圈(1)
164
8
苹果馅饼(1/6 8 英寸)
430
19
爆米花(3 杯)
192
11
冰激凌(1/2 杯)
175
12
巧克力条饼干(1 大号)
236
12
奶酪饼干(2 盎司,10 薄)
429
26
鸡翅膀(2)
318
21
奶酪面包圈
249
11
花生酱杯(2)
281
16
干烤花生(1oz)
160
14
巧克力条(1oz)
147
9
奶酪或花生酱饼干(6)
210
9
麦片条(1)
120
5
案例 2-阿曼达比萨连锁店
2
问题:学生人数与阿曼达比萨销售收入之间关系?有一家连锁店位于 16000 名学生的校
园附近,预测这家连锁店的季度销售收入?
连锁店 i
学生人数 x
i
/千人
销售收入 y
i
/千美元
1
2
3
4
5
6
7
8
9
10
2
6
8
8
12
16
20
20
22
26
58
105
88
118
117
137
157
169
149
202
案例 3-游泳
穆尔教授为了摆脱中年形象,定期游泳且每次游泳两千码。以下是他游的时间(分钟)
及游完后的脉搏(每分钟搏动次数)的 23 笔资料:
时间
34.12
35.72
34.72
34.05
34.13
35.72
36.17
35.57
脉搏
152
124
140
152
146
128
136
144
时间
35.37
35.57
35.43
36.05
34.85
34.70
34.75
33.93
脉搏
148
144
136
124
148
144
140
156
时间
34.60
34.00
34.35
35.62
35.68
35.28
35.97
脉搏
136
148
148
132
124
132
139
定量分析他游的时间(分钟)与游完后的脉搏(每分钟搏动次数)是否存在依存关系?
案例 4-化石分类
始祖鸟(archaeopteryx),是一种已灭绝的动物,它有像鸟类一样的羽毛,但是也有像
爬虫类的牙齿及长而多骨的尾巴。已知的化石标本只有 6 个,因为这些标本的大小差很多,
有些科学家认为这些标本可能是不同的种类,而不是同一种类的不同个体。在 5 个仍同时保
有股骨(一种腿骨)以及肱骨(上臂的骨头)的标本中,我们检查股骨及肱骨的长度,以下
就是这组资料,单位是厘米:
股骨
38
56
59
64
74
舷骨
41
63
70
72
84
案例 5-收入与学历
在美国接受过大学教育的人,一生工作的收入要比高中毕业的人多出百万美元,这一趋
势在 20 世纪 70 年就已显现,到了 20 世纪 90 年代,由于高科技产业的兴起和经济全球化的
结果,社会对高科技、商业管理人才的需求量大增,大学毕业生收入增长的幅度远远超过高
中毕业生收入的增长幅度,也使得教育与收入成正比成为普遍现象。
教育程度
终身收入(按工作 40 年计算)
职业性学位
440 万美元
3
博士毕业
340 万美元
硕士毕业
250 万美元
大学毕业
210 万美元
大专毕业
160 万美元
受过高等教育但未获学位
150 万美元
高中毕业
120 美元
高中以下
100 万美元
无论是在自然界还是社会经济领域,一种现象与另一种现象之间往往存在着依存关系,
当我们用变量来反映这些现象的特征时,便表现为变量之间的依存关系。如某种商品的销售
额(y)与销售量(x)之间的关系、商品销售额(y)与广告费支出(x)之间的关系以及粮
食亩产量(y)与施肥量(
1
x
)、降雨量(
2
x
) 、温度(
3
x
)之间的关系等。统计学的主
要研究对象是随机变量,在多个变量的时候,至少有一个变量是随机变量,因此我们对变量
之间关系的分析是随机变量之间的关系或随机变量与确定变量之间的关系。
相关分析与回归分析是研究客观现象之间数量联系的重要统计方法,用于研究随机变量
之间的关系或随机变量与确定变量之间的关系。对于相关分析和回归分析既可以从描述统计
的角度也可以从推断统计的角度来说明。
剩余12页未读,继续阅读
niewzh
- 粉丝: 381
- 资源: 16
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0