资料统计——单变量推论统计
单变量推论统计是统计学的一种方法,用于根据样本数据来推断总体参数。总体是指所有元素的集合体,而样本是从总体中抽取的一部分元素的集合。参数值是总体中某一变量的综合描述,而统计值是样本中某一变量的综合描述。
单变量推论统计的要点包括:根据样本的统计值来推测总体的参数值;统计推论以概率论为基础,因此统计推论的方法主要适用于概率(随机)抽样的数据;抽样分布原理是统计推论的依据。
单变量推论统计有两种模式:参数估计和假设检验。参数估计是根据随机样本的统计值对总体的参数值进行估计,而假设检验是首先假设总体的情况,然后通过随机样本的统计值来检验这个假设是否正确。
参数估计有两种形式:点估计和区间估计。点估计用一个数值来估计总体参数,而区间估计用一个取值范围来估计总体参数。点估计常用总体参数的点估计包括总体均值、总体方差、总体标准差和总体成数等。然而,参数点估计比较简单,但参数点估计很难计算出估计的精度(可信度),因此研究中使用不多。
区间估计用一个范围或一个区间来对未知参数进行估计,如估计某城市居民的平均月收入在 800 - 1000 元之间。区间估计的实质是在一定的可信度(置信度 / 置信概率)下,用样本统计值的某个范围(置信区间)来“框”住总体的参数值。
相关概念包括:置信区间(confidence interval)—— 总体参数的估计范围;置信度(confidence coefficient)1 - α —— 置信区间估计的可靠性;显著性水平(significance level)α—— 置信区间估计的不可靠的概率。
置信度(1 - α)与显著性水平 α 之间存在着对立统一的关系。置信度是估计可靠的概率,而显著性水平是不可靠的概率。置信度+显著性水平= 1 ;如果提出置信度要求为 0.95,那么意味着显著性水平为 0.05。
单变量推论统计是统计学的一种重要方法,用于根据样本数据来推断总体参数。了解单变量推论统计的概念和方法对于数据分析和研究具有重要意义。