随机变量是概率论和统计学中的核心概念,用于描述不确定性事件的结果。随机变量分为两种主要类型:离散型和连续型。
离散型随机变量的取值是有限个或者可数无限个特定的值,例如投掷骰子的点数。它们的分布规律通过分布律来描述,例如两点分布(0-1分布)只有两个可能的结果,二项分布则适用于多次独立重复试验中成功的次数,如伯努利试验。泊松分布则是描述在固定时间或空间区域内发生稀疏随机事件的次数。
两点分布是二项分布的一个特殊情况,其中只有两种可能的结果,比如成功或失败,且每次试验的成功概率相同。二项分布参数为n(试验次数)和p(单次试验成功的概率),记为X~B(n,p),其概率质量函数是基于伯努利公式计算的。
分布函数F(x)是随机变量X取值小于或等于x的概率,它是非减的,并且在x取最大值时等于1。对于离散型随机变量,分布函数在每个可能值处可能有跳跃,跳跃幅度等于该值出现的概率。
连续型随机变量的分布不能通过离散的点来描述,而是通过概率密度函数(f(x))来表示,它在任何一点的概率为0,但在区间上的积分给出了变量落在该区间内的概率。均匀分布是其中的一种,其概率密度函数在整个定义域内是常数,指数分布则描述了等待某个事件发生的平均时间,而正态分布(高斯分布)是最常见的连续分布,具有钟形曲线,其均值μ和方差σ²决定了分布的中心位置和宽度。
标准正态分布是μ=0,σ²=1的正态分布,其累积分布函数(CDF)是著名的φ函数,广泛应用于统计推断中。正态变量可以通过标准化转化为标准正态变量,从而利用标准正态分布表进行概率计算。
对于离散型随机变量x的分布问题,可以计算其期望值和方差,以及利用分布律解决特定事件的概率。对于连续型随机变量,可以找到其分布函数F(y)来计算y以下的概率,或者利用概率密度函数f(y)来求解涉及连续变量的复合函数的概率密度。
随机变量及其分布是概率论的基础,理解和掌握这些知识对于数据分析、统计推断以及工程决策等领域至关重要。