没有合适的资源?快使用搜索试试~ 我知道了~
概率,统计,线性模型分析
资源推荐
资源详情
资源评论
线性模型分析原理
Principles of Linear Model Analysis
朱 军 著
内容简介
本书系统地介绍了近二十年来统计学,尤其在线
性模型统计分析原理方面的一些新发展。所介绍的主
要内容包括简单和多元回归模型分析、非线性模型分
析、方差分析、混合线性模型分析等。
本书可作为数理统计相关学科的研究生教材,也
可供统计学、数量遗传学、农学等方面的教学与研究
人员参考。
科学出版社
2000
《
线性模型分析原理
》
朱军著
科学出版社
2000
·
1
·
第一章. 概率论和统计学的基本原理
§1.1 概 率
统计学(statistics)是一门数据分析的科学. 它研究数据的
取样、收集、组织、总结、表达和分析的科学方法,也研究
如何根据数据的分析结果作出关于总体特性的有效推断和合
理结论的科学方法. 在统计学中,总体(population)是指所要研
究的对象的所有个体的总和. 在实际统计分析时,通常不可能
研究所有的个体,而是在总体中选取一部分个体进行分析. 这
些在实际研究中被分析的个体,称为样本(sample).
通过对样本资料的统计分析,可以推断总体的表现. 为了
确保统计推断的可靠性,需要按事先设计的要求观察和收集
数据. 这种过程称为试验(experiment). 实施试验所获得的任
何可能结果称为试验的一次结局(outcome). 如果重复实施设
计相同的试验,可以获得结果不尽相同的结果. 试验的一次或
若干次结局,称为事件(event). 常用大写字母A,B,C 等表
示事件. 试验的所有可能结局称为试验的样本空间(sample
space).
如果事件A的概率为P(A),则A的对立事件的概率为P(
A
) =
1−P(A). 如果存在二个事件A和B,事件A或者事件B发生,称
为事件A与事件B的和,其概率以P(A U B)表示. 事件A与事件B
同时发生,称为事件A与事件B的积. 其概率表示为P(A I B).
在事件B出现的条件下事件A发生的概率,称为给定事件B时事
件A的条件概率,表示为P(A|B). 当事件A与事件B相互独立时,
P(A|B) = P(A) 或P(B|A) = P(B).
概率的基本运算法则是
事件A发生或者事件B发生的概率
《
线性模型分析原理
》
朱军著
科学出版社
2000
·
2
·
P(A U B)=P(A)+P(B)−P(A I B)
事件A与事件B同时发生的概率P(A I B) = P(A)P(B|A)
= P(B)P(A|B)
当事件A和事件B互不相容时,事件A发生或者事件B发生的
概率为
P(A U B) = P(A) + P(B)
如果事件A和事件B为独立事件,事件A与事件B同时发生的概率
为
P(AI B) = P(A)P(B)
§1.2 随机变量
统计分析的目的是要推断总体的特性. 在统计学中,描述
总体特性的数值称为参数(parameter). 总体的参数一般是未
知的,需要经统计分析而推断. 通常的作法是在总体中抽取一
个样本,由分析样本数据而获得一个可用于估计总体参数的
数值. 这个数值称为总体参数的点估计(point estimate).
当从一个总体中抽取不同的样本,分析各样本所获得的点
估计将不尽相同. 这种表现出变异性的特征, 称为变量
(variable). 在作统计试验以前,我们一般并不知道某一试验的
确切结局,但是我们可以赋予试验结局以实际数量的一个函
数. 因此这一变量称为随机变量(random variable). 随机变量
常用大写字母表示,如 X, Y,Z. 它们可能出现的具体结果
或数值则可用小写字母表示,如 x,y,z.
随机变量有二类. 一类是以计数表示的随机变量,称为离
散变量(discrete variable);另一类是以任意实数表示的随机变
量,称为连续变量(continuous variable).
随机变量之间常存在不同程度的关联性,这些关联性可以
用数学模型或数学函数表示. 其中应用最多的是线性模型
(linear model). 线性模型是描述变量之间相互关系的数学函
数,它的参数只具有简单的线性关系. 在统计分析中广泛应用
《
线性模型分析原理
》
朱军著
科学出版社
2000
·
3
·
的回归分析、相关分析、方差分析、协方差分析等都是建立
在线性模型的理论基础上的.
在重复试验中随机变量X为 x值的概率可以用概率密度函
数(probability density function,简称pdf)表示:
f(x) = P(X = x) (1.1)
概率密度函数具有以下特性,
(1) 对于所有的x值,0 ≤ f(x) ≤ 1
(2) 对于离散变量有
∑
=1)(xf 或连续变量则有 f x dx( ) =
∫
1
在重复试验中随机变量X小于或等于x值的累计概率可以
用分布函数(distribution function)表示:
F(x) = P(X ≤ x) (1.2)
分布函数具有以下特性,
(1)
0)(lim =
−∞→
xF
x
(2)
1)(lim =
∞→
xF
x
(3)
)()(lim
0
xFhxF
h
=+
→
(4) 如果 a b
<
, 那么F(a) ≤ F(b)
(5) P(a < X ≤ b) = F b F a( () )
−
如果某一随机变量X在试验中可能出现的具体结果x具有
概率密度函数f(x),则随机变量X的期望值(expected value)定义
为:
∑
x
xxfXE )(=)( 如果X是离散随机变量 (1.3)
∫
∞
∞−
dxxxfXE )(=)( 如果X是连续随机变量 (1.4)
根据随机变量期望值的定义,可以进一步推算随机变量线
性函数的期望值. 随机变量X和常数a和c的线性函数(a + cX)
的期望值为
E(a+cX) = E(a) + E(cX)
= a+cE(X)
其中常数的期望值仍为原常数.
两个随机变量X和Y的函数期望值为
E(aX+cY) = aE(X)+cE(Y)
《
线性模型分析原理
》
朱军著
科学出版社
2000
·
4
·
E(XY) = E(X)E(Y) 如果X和Y 是独立的随机变量.
如果X
1
,X
2
,…,X
i
,…,X
n
是n个随机变量,它们的线性函
数 a X
i i
i
n
=
∑
1
的期望值为
E a X a E X
i i
i
n
i i
i
n
( (
= =
∑ ∑
=
1 1
) )
随机变量X的方差(variance)定义为
σ
2
( }
) [
X E X E X
E X E X
) = {[ ( )]
= ( ( )]
2
2 2
−
−
(1.5)
随机变量X和常数a和c的线性函数(a+cX)的方差为
Var(a+cX) = Var(a) + Var(cX)
= c
2
σ
2
(X )
其中常数的方差为零.
随机变量X和Y的协方差(covariance)定义为
)()()(=
)]}()][({[=),(
YEXEXYE
YEYXEXEYX
−
−
−
σ
(1.6)
给定常数a,b,c和d,则随机变量X和Y的线性函数的协方差
为
Cov(a+cX,b+dY) = cd
σ
( , )X Y
随机变量X与X的协方差即为X的方差
22
)]([)(=
(X))()(=
(X)]})][X({[=),(
XEXE
EXEXXE
EXEXEXX
−
−
−−σ
如果X
1
,X
2
,…,X
i
,…,X
n
是n个随机变量,它们的线性
函数
∑
=
n
i
ii
Xa
1
的方差为
Var( a X
i i
i
n
=
∑
1
)
= a a X X
i j i j
j
n
i
n
σ( , )
==
∑∑
11
剩余210页未读,继续阅读
资源评论
悦峰
- 粉丝: 138
- 资源: 7
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功