在概率论与数理统计中,随机变量是一个重要的概念,它可以是离散型或连续型。第四章主要探讨的是连续型随机变量。连续型随机变量与离散型随机变量不同,因为它们的所有可能取值是无限多且无法一一列举的,这使得它们不能直接用离散型随机变量的分布律来描述。
分布函数在这里起到了关键作用,它是一个非减的、右连续的函数,用来描述随机变量小于或等于某个特定值的概率。对于任意实数x,随机变量ξ的分布函数F(x)表示ξ取值小于或等于x的概率。分布函数能够帮助我们理解随机变量的整体行为,因为它给出了随机变量落在任意区间的概率。
连续型随机变量的概率分布通常通过概率密度函数(probability density function, PDF)来描述,它是分布函数的一个导数。在给定的例子中,产品尺寸ξ的概率密度可以通过统计样本的频率分布近似得到,当样本数量趋于无穷大且分组间隔趋近于零时,频率分布直方图会逼近一个光滑曲线,这就是概率密度函数曲线。随机变量ξ落在某区间的概率等于这个区间下概率密度函数曲线所围成的面积。
另一个例子是射击距离r,我们关注的是r落在某个区间内的概率,这可以通过概率密度函数计算。类似地,对于灯泡寿命T这样的随机变量,我们关心的是T落在特定区间或大于某个值的概率,这也可以通过分布函数和概率密度函数来确定。
定义随机变量ξ的分布函数F(x),对于任意实数x,F(x)表示ξ取值小于或等于x的概率。如果知道ξ的分布函数,那么我们就能完全描述ξ的所有统计特性,包括期望、方差等数字特征。
例如,给定一个离散型随机变量ξ的分布律,其分布函数F(x)可以通过累积其对应概率得到。如果ξ的可能取值为x1, x2, ...,则分布函数在这些点的值分别是F(x1) = p1, F(x2) = p1 + p2, ...,其中pi是ξ取值xi的概率。
总结来说,第四章主要介绍了如何用分布函数和概率密度函数来理解和描述连续型随机变量的特性,提供了计算随机变量落在特定区间概率的方法,并通过实例展示了如何从统计数据中构建这些概率模型。这些都是概率论与数理统计中的基础概念,对于理解和应用统计学至关重要。