数理统计课件西工大研究生
数理统计是应用数学的一个重要分支,主要研究随机现象的数量规律性,通过收集、分析数据来推断总体特征,为决策提供依据。本课件针对的是西安工业大学(西工大)的研究生,旨在帮助学生深入理解和掌握数理统计的基本概念、方法及应用。 一、基本概念 1. 随机变量:在随机试验中,每个结果都有确定的概率,并可以用一个数值表示,这样的变量称为随机变量。 2. 概率:表示某一事件发生的可能性,通常在0到1之间。 3. 分布函数:描述随机变量所有可能取值及其概率的函数。 4. 累积分布函数(CDF):随机变量小于或等于某个值的概率。 5. 概率密度函数(PDF):连续随机变量的概率分布,其积分等于1。 6. 密度函数与分布函数的关系:对于连续随机变量,CDF的导数即为其PDF。 二、统计量 1. 总体与样本:总体是具有相同性质的个体集合,样本是从总体中抽取的一部分。 2. 参数:描述总体特征的未知数。 3. 统计量:由样本数据计算得到的量,用来估计或推断总体参数。 4. 平均数(均值):样本数据的算术平均,代表样本的集中趋势。 5. 方差与标准差:衡量样本数据离散程度的统计量,方差是各数据与均值之差的平方和的平均,标准差是方差的非负平方根。 6. 中位数:将样本数据按大小排列后处于中间位置的数,不受极端值影响。 7. 四分位数:将样本数据分为四等份的分割点,包括下四分位数(Q1)、中位数(Q2,第二四分位数)和上四分位数(Q3)。 三、抽样分布 1. 抽样分布:相同大小的样本统计量在多次重复抽样下的分布。 2. 正态分布:最常见的抽样分布,具有对称、钟形的特点,平均数等于中位数等于模式。 3. 中心极限定理:当样本容量足够大时,样本均值的抽样分布近似正态分布,即使总体分布不是正态的。 4. t分布:小样本情况下,样本均值的标准误差未知时,其抽样分布称为t分布。 5. 卡方分布:用于检验拟合优度和独立性,样本方差的分布通常遵循卡方分布。 6. F分布:在两个独立样本方差比较时,其比值的抽样分布称为F分布。 四、假设检验 1. 假设检验:对总体参数进行推断的方法,通过设定零假设和备择假设,根据样本统计量的值决定是否拒绝零假设。 2. 显著性水平:在假设检验中,允许犯第一类错误的概率。 3. p值:在给定显著性水平下,观察到当前或更极端结果的概率,若p值小于显著性水平,则拒绝零假设。 4. 临界值:在假设检验中,根据显著性水平确定的边界值,如果统计量超过这个值,就拒绝零假设。 五、置信区间 1. 置信区间:以一定置信水平给出的参数估计范围。 2. 置信水平:表示区间包含真实参数的概率,如95%置信水平意味着在100次估计中有95次能包含真实值。 六、回归分析 1. 线性回归:研究两个或多个变量间线性关系的统计方法。 2. 相关系数:衡量两个变量间线性关系的强度和方向,取值范围在-1到1之间。 3. 最小二乘法:求解回归直线,使得预测值与实际值的残差平方和最小。 通过这些内容的学习,西工大的研究生可以系统地理解并运用数理统计知识,不仅在课堂上,更能在科研和实际问题解决中发挥重要作用。
- 1
- 粉丝: 7
- 资源: 21
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
- 1
- 2
前往页