chapter非参数统计详解实用PPT课件.pptx资源-CSDN文库

版权申诉

54 浏览量 2021-10-06 21:42:08 上传评论收藏 1.13MB PPTX 举报

非参数统计是一种统计学方法，它对总体的假设较少，主要关注数据的顺序或排名，而非具体的数值分布形式。这种方法的优点在于效率高、结果稳定，适用于各种类型的数据，包括分类数据和连续数据。非参数统计的历史可以追溯到20世纪40年代至50年代，随着Wilcoxon两样本秩和检验、Mann-Whitney U检验的提出，以及Pitman对非参数方法相对效率的研究。随后的几十年，非参数统计不断发展，尤其是在60年代，Hodges和Lehmann通过秩检验统计量导出了一系列估计量和置信区间。到了70-80年代，随着计算机技术的进步，非参数统计在回归和密度估计等领域取得了更多进展。非参数假设检验是统计学中的一个重要概念，它的基本思想是对总体的某些特性进行推断，先设定零假设H0，然后在H0成立的情况下，通过选择适当的统计量来构建一个小概率事件。如果这个小概率事件在实际观测中发生了，就拒绝H0；反之，如果没发生，就接受H0。在选择零假设和备择假设时，通常将样本表现出的特征作为备择假设，而零假设是对备择假设的对立面。在假设检验中，p值和显著性水平是关键，p值表示在零假设下观测到当前或更极端结果的概率，而显著性水平决定了我们拒绝零假设的阈值。第一类错误（弃真错误）是指在零假设真实的情况下错误地拒绝了它，第二类错误（取伪错误）则是指在零假设不真实时未能拒绝它。这两类错误之间的平衡是检验设计的重要考虑因素。置信区间与假设检验之间存在对偶关系，对于单变量位置参数，显著性水平α和置信水平1-α是互为对立的。如果一个置信水平为1-α的置信区间不包含零假设的值，那么我们就拒绝零假设。例如，对于正态总体的均值检验，U检验就是这样的例子。经验分布函数（EDF）是基于样本数据构建的分布估计，它给出了样本值小于或等于任意值x的频率。在大样本情况下，根据伯努利大数定律，经验分布函数趋向于样本的真实分布。生存分析是研究生存时间数据的一种统计方法，广泛应用于生物、医学、保险等多个领域。生存函数S(t)表示个体在时间t之后仍能生存的概率，其性质包括S(0)=1，S(+∞)=0，且S(t)随t增加而单调递减。生存函数可以通过经验分布函数来估计，而危险函数则反映了在特定时间点之后的瞬时死亡率。非参数统计方法还包括多种生存分析技术，如乘积极限法、寿命表法、logrank检验和Gehan比分检验，以及半参数方法如Cox回归模型，这些方法在处理生存时间数据时提供了灵活性，无需对生存时间的分布做出严格的假设。

资源推荐

资源详情

资源评论