没有合适的资源?快使用搜索试试~ 我知道了~
大学生--医学统计学总结.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 122 浏览量
2021-12-30
18:05:13
上传
评论
收藏 522KB PDF 举报
温馨提示
试读
19页
大学生--医学统计学总结
资源推荐
资源详情
资源评论
医学统计学总结
绪论
1
、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在一定数量的重复试验之
后呈现统计规律的现象。
2
、同质:统计学中对研究指标影响较大的,可以控制的主要因素。
3
、变异:同质基础上各观察单位某变量值的差异。
数值变量:变量值是定量的,由此而构成的资料称为数值变量资料或计量资料,其数
值是连续性的,称之为连续型变量。
变量 无序分类变量:所分类别或属性之间无顺序和程度上的差异
分类变量 :定性变量
有序分类变量:有顺序和程度上的差异
4
、总体:根据研究目的确定的同质研究对象中所有观察单位某变量值的集合。可以分为有限
总体和无限总体。
5
、样本:是按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。样本代表
性的前提:同质总体,足够的观察单位数,随机抽样。
统计学中,描述样本特征的指标称为统计量,描述总体特征的指标称为参数。
6、概率:描述随机事件发生的可能性大小的一个度量。若 P(A)=1,则称 A 为必然事件;若
P(A)=0,则称 A 为不可能事件;随机事件 A 的概率为 0<P<1.
小概率事件:若随机事件 A 的概率 P≤α,则称随机事件 A 为小概率事件,其统计学意义为:
小概率事件在一次随机试验中认为是不可能发生的。
统计描述
1、频数分布有两个重要的特征:集中趋势和离散程度。频数分布有对称分布和偏态分布之分。
后者是指频数分布不对称,集中趋势偏向一侧,如偏向数值小的一侧为正偏态分布,如偏向数
值大的一侧为负偏态分布。
2、常用的集中趋势的描述指标有:均数,几何均数,中位数等。
均数:适用于正态或近似正态的分布的数值变量资料。样本均数用
x
表示,总体均数用μ
表示。
几何均数:适用于等比级数资料和对数呈正态分布的资料。注意观察值中不能有零,一组
观察值中不能同时有正值和负值。
中位数:适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。
3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数。
全距:任何资料,一组中最大值与最小值的差。
四分位数间距:适用于偏态分布以及分布的一端或两端无确切数据资料。
方差和标准差:正态分布资料。标准差表示观察值的变异度的大小。
变异系数:比较度量单位不同或均数相差悬殊的两组资料的变异度。
4、标准正态分布:对正态分布的(X-μ)/σ进行 u 的变换,u=(X-μ)/σ,则正态分布变
换为μ=0,σ=1 的标准正态分布,亦称 u 分布。u 被称为标准正态变量或标准正态离差。
两个参数:μ是位置参数,σ是形状参数。通常用 N(μ,σ
2
)表示均数为μ,方差为σ
2
的
正态分布,用 N(0,1)表示标准正态分布。
创创大帝
常用估计医学参考值范围的方法有:
(1) 正态分布方法:适用于正态或近似正态分布的资料。
双侧界值:X±u
σ/2
S 单侧上界:X+u
σ
S,或单侧下界:X-u
σ
S
(2) 对数正态分布方法:适用于对数正态分布资料。
双侧界值:Lg
-1
(X
lgx
±u
σ/2
S
lgx
) 单侧上界:Lg
-1
(X
lgx
+u
σ
S
lgx
),
或单侧下界:Lg
-1
(X
lgx
-u
σ
S
lgx
)
(3)百分位数法:用于偏态分布资料以及资料中一端或两端无确切数值的资料。
双侧上界:P
2.5
和 P
97.5
;单侧上界:P
95
,或单侧下界:P
5
常用的 u 值表
5、分类变量资料的统计描述:常用相对数指标描述,包括:率,构成比,相对比。
率:说明某现象发生的频率或强度。(病死率不等于死亡率)
构成比:说明某现象内部组成部分所占的比重或分布,常以百分数表示。
相对比:亦称比,是 A、B 2 个有关指标之比,说明 A 为 B 的若干倍或百分之几。两个指
标可以性质相同,也可以性质不同。
应用相对数时的注意事项:
1、计算相对数的分母不宜过小;2、分析时不能以构成比代替率;3、对观察单位数不等
的几个率,不能直接相加求其平均虑;4、比较相对数时应注意其可比性;5、对样本率(或构
成比)的比较应遵循随机抽样,并做假设检验。
6、标准化法:标准化的目的在于消除混杂因素对结果的影响,使资料更具有可比性。其基本
思想是:将所比较的两组或多组资料的构成按统一的“标准”调整后,计算标化率,使其更具
有可比性。
标准化率的计算方法:亦称标化率,直接法用于已知被标化组的年龄别率,以及已知标准组的
年龄别人口数或年龄别人口构成比时;间接法用于已知被标化组的年龄别人口数与发病(死亡)
总数,但年龄别率未知,以及已知标准组年龄别发病(死亡)率与总发病(死亡)率时。
通常可从下列 3 种方法选用标准组:①以两组资料中任一组的年龄别人口数或构成比作为标准
组;②以两组资料合并的各年龄组的人口数或构成比作为标准组;③以公认的或便于与他人资
料比较的标准作为标准组。
7、统计表:
结构:由标题、标目、线条和数字构成。
编制统计表的要求:
①标题:概括表的内容,列于表的上方居中,应注明时间和地点;
②标目:主语和谓语分别列于横、纵标目,文字简明,层次清楚。横标目列于表的左侧,通常
为被研究的事物,纵标目列于表的上端,为说明横标目的统计指标。
③线条:通常,除表的顶线、底线、纵标目下以及合计上的横线外,其余线条均省去,顶线和
底线应略粗些,表的左上角不宜用斜线。
④数字:用阿拉伯数字表示,同一指标的小数位数要一致并对齐,数字暂缺或无数字者分别用
“…”或“-”表示,数字为 0 者要记作“0”,不应空项,为方便核实和分析,应有合计。
参考值范围(%) 单侧 双侧
80 0.842 1.282
90 1.282 1.645
95 1.645 1.96
99 2.326 2.576
创创大帝
⑤备注:一般不列入表内,必要时可用“*”标出,列于表下。
8、统计图:
①条图:用于相互对比关系的资料;
②圆图与百分条图:适用于百分构成比资料,表示事物各组成部分所占的比重或构成;
③线图:用于连续性资料,用于说明事物在时间上的发展变化,或某现象随另一现象而变动的
情况;
④直方图:表示连续性资料的频数分布;
⑤散点图:适用于直线相关分析,说明两个变量间的数量关系和变化趋势。
抽样分布与参数估计
抽样研究的目的是用样本信息来推断总体特征,即统计推断,包括两个内容:一是总体参数的
估计,二是假设检验。
1、抽样误差:由于变异的存在,抽样研究所造成的样本统计量与总体参数之间的差异或各样
本统计量之间的差异称为抽样误差。
常用标准误
x
反映均数抽样误差的大小;用率的标准误σ
p
反映率的抽样误差的大小;用
Possion 计数的标准误
μ
反映其抽样误差的大小。
2、中心极限定理和正态分布推理:从正态分布 N(μ,σ
2
)总体中以固定 n 随机抽取样本,
样本均数
x
的分布仍服从正态分布,即使是从偏态分布总体中随机抽样,只要 n 足够大,
x
的
分布也近似正态分布。样本均数的均数仍为μ,样本均数的标准差为
x
。
样本均数的抽样误差
x
(简称标准误)是反映均数抽样误差大小的指标。
x
=
n
σ
用样本均数 S 作为σ的估计值,则
x
s
=
n
S
3、t 分布:将
x
看成变量值,那么可将正态变量进行 u 变换(u=
x
-μ/σ)后,也可将 N(μ,
2
x
)变换成标准正态分布 N(0,1)。常用 s 作为σ的估计值,统计量为 t,此分布为 t 分布。
统计量 t=
x
s
x
t 曲线的形态变化与自由度 v 的大小有关。v 越小,t 值越分散,曲线越低
平,v 逐渐增大时,则 t 分布逐渐逼近正态分布,当 v=无穷大时,t 分布即为 u 分布。
4、总体均数的估计有两种方法:一种是点估计,即用统计量
x
估计总体均数
;二是区间估
计,亦称可信区间。
(1)σ未知且 n 小:
x
-t
α/2,v
s
x
<μ<
x
+t
α/2,v
s
x
(2)σ未知,但 n 足够大,t 分布逼近 u 分布:
x
-u
α/2
s
x
<μ<
x
+u
α/2
s
x
(3)σ已知:
x
-u
α/2
σ
x
<μ<
x
+u
α/2
σ
x
创创大帝
标准差和标准误的比较
标准差 标准误
S=
1
)(
2
n
xx
x
s
=
n
s
表示观察值的变异程度大小 估计均数的抽样误差大小
计算变异系数 CV=
x
s
100% 估计总体均数可信区间
x
-t
α/2,v
s
x
<μ<
x
+t
α/2,v
s
x
确定医学参考值的范围 进行假设检验
计算标准误
数值变量资料的假设检验
1、假设检验的原理:假设在一次抽样研究中得出了 u≥1.96,则 P≤0.05,此为小概率事件,
依据“小概率事件在一次随机试验中认为是不可能发生的”的定理,可认为此样本不是来自该
总体。
2、步骤:①建立假设和确定检验水准;假设有两种,一种是检验假设,常称无效假设或零假
设,记为 H
0
,假设样本所代表的总体参数与已知总体参数相等;另一种是备择假设,记为 H
1
,
是与 H
0
相联系且对立的假设;检验水准,亦称显著性水准,是判断拒绝或不拒绝 H
0
,也是允
许犯Ⅰ型错误的概率,通常用 0.05。
②选定检验方法和计算统计量③确定 P 值,做出推断结论。P 值是指从 H
0
所规定的总体中随机
抽样时,获得等于及大于现有样本统计量的概率。
3、t 检验:适用于:①样本均数与总体均数比较(σ未知且 n<50 或 n<30);②成组设计的
两小样本均数的比较(n
1
,n
2
均小于 30 或 50);③配对设计的两样本均数比较。
应用条件:①当样本含量较小(n<50 或 n<30)时,要求样本来自正态分布总体;②用于成
组设计的两样本均数比较时,要求两样本来自总体方差相等的总体。
4、单样本 t 检验:用于样本均数与已知总体均数的比较,研究目的是推断样本所代表的总体
均数μ与已知总体均数μ
0
有无差别。统计量 t=
n/s
0
μx
v=n-1
5、配对 t 检验:用于配对设计资料的两均数的比较。其研究目的是推断某种处理有无作用,
或两种处理的效果有无差别。
配对设计类型有 3 种:①先将受试对象按配比条件配对,然后用随机分组方法将各对中的 2
个受试对象分别分配到不同的处理组;②同一对象分别接受 2 种不同处理;③同一对象处理前
后。t=
n/s
d
d
(
d
是差值的样本均数)v=n-1
6、两样本 t 检验:用于完全随机设计的两样本均数的比较,两个样本来自两个总体,其研究
目的是推断两样本所分别代表的总体均数是否相等。
创创大帝
剩余18页未读,继续阅读
资源评论
创创大帝(水印很浅-下载的文档)
- 粉丝: 2287
- 资源: 5389
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功