chapter非参数统计详解实用PPT课件.pptx
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
非参数统计是一种统计学方法,它对总体的假设较少,主要关注数据的顺序或排名,而非具体的数值分布形式。这种方法的优点在于效率高、结果稳定,适用于各种类型的数据,包括分类数据和连续数据。非参数统计的历史可以追溯到20世纪40年代至50年代,随着Wilcoxon两样本秩和检验、Mann-Whitney U检验的提出,以及Pitman对非参数方法相对效率的研究。随后的几十年,非参数统计不断发展,尤其是在60年代,Hodges和Lehmann通过秩检验统计量导出了一系列估计量和置信区间。到了70-80年代,随着计算机技术的进步,非参数统计在回归和密度估计等领域取得了更多进展。 非参数假设检验是统计学中的一个重要概念,它的基本思想是对总体的某些特性进行推断,先设定零假设H0,然后在H0成立的情况下,通过选择适当的统计量来构建一个小概率事件。如果这个小概率事件在实际观测中发生了,就拒绝H0;反之,如果没发生,就接受H0。在选择零假设和备择假设时,通常将样本表现出的特征作为备择假设,而零假设是对备择假设的对立面。在假设检验中,p值和显著性水平是关键,p值表示在零假设下观测到当前或更极端结果的概率,而显著性水平决定了我们拒绝零假设的阈值。第一类错误(弃真错误)是指在零假设真实的情况下错误地拒绝了它,第二类错误(取伪错误)则是指在零假设不真实时未能拒绝它。这两类错误之间的平衡是检验设计的重要考虑因素。 置信区间与假设检验之间存在对偶关系,对于单变量位置参数,显著性水平α和置信水平1-α是互为对立的。如果一个置信水平为1-α的置信区间不包含零假设的值,那么我们就拒绝零假设。例如,对于正态总体的均值检验,U检验就是这样的例子。 经验分布函数(EDF)是基于样本数据构建的分布估计,它给出了样本值小于或等于任意值x的频率。在大样本情况下,根据伯努利大数定律,经验分布函数趋向于样本的真实分布。生存分析是研究生存时间数据的一种统计方法,广泛应用于生物、医学、保险等多个领域。生存函数S(t)表示个体在时间t之后仍能生存的概率,其性质包括S(0)=1,S(+∞)=0,且S(t)随t增加而单调递减。生存函数可以通过经验分布函数来估计,而危险函数则反映了在特定时间点之后的瞬时死亡率。 非参数统计方法还包括多种生存分析技术,如乘积极限法、寿命表法、logrank检验和Gehan比分检验,以及半参数方法如Cox回归模型,这些方法在处理生存时间数据时提供了灵活性,无需对生存时间的分布做出严格的假设。
剩余49页未读,继续阅读
- 粉丝: 1405
- 资源: 52万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助