偏差
偏差又称为表观误差,是指个别测定值与测定的平均值之差,它可以用来衡量测
定结果的精密度高低[1]。在统计学中,偏差可以用于两个不同的概念,即有偏
采样与有偏估计。一个有偏采样是对总样本集非平等采样,而一个有偏估计则是
指高估或低估要估计的量。
偏差不一定有害。尽管一个有偏采样会难以分析或引起不准确甚至错误的推断,
但是有偏估计在某些情况下也有一些好的特性,例如较小的方差。
偏差分为绝对偏差和相对偏差、标准偏差和相对标准偏差来表示。
绝对偏差:是指某一次测量值与平均值的差异。
相对偏差:是指某一次测量的绝对偏差占平均值的百分比。
标准偏差:是指统计结果在某一个时段内误差上下波动的幅度。
平均偏差:是指单项测定值与平均值的偏差(取绝对值)之和,除以测定次
数。
相对标准偏差:是指标准偏差占平均值的百分率。平均偏差和相对平均偏差
都是正值。
Eg:分析铁矿石中铁的质量分数,得到如下数据:37.45,37.20,37.50,37.30,
37.25(%),计算测结果的平均值、平均偏差、相对平均偏差、标准偏差。
解:平均值:(37.45+37.20+37.50+37.30+37.25)/5 = 37.34
各次测量的偏差分别是:0.11,-0.14,0.16,-0.04,-0.09
方差
方差(variance)是在概率论和统计方差衡量随机变量或一组数据时离散程度的度
量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。
统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。
在许多实际问题中,研究方差即偏离程度有着重要意义。
方差是衡量源数据和期望值相差的度量值。
(1)
(2)设
是常数,则
(3)设
是随机变量,
是常数,则有
(4)设
与
是两个随机变量,则
其中协方差
特别的,当
是两个不相关的随机变量则
此性质可以推广到有限多个两两不相关的随机变量之和的情况。
(5)
的充分必要条件是
以概率 1 取常数
,即
当且仅当
取常数值
时的概率为 1 时,
。
注:不能得出
恒等于常数,当
是连续的时候,
可以在任意有限个点取不等于
常数 c 的值。
(6)
bias & variance
偏差(bias):描述的是预测值(估计值)的期望与真实值之间的差距。偏差越
大,越偏离真实数据,如下图第二行所示。
评论0