第26章-分位数回归1

preview
需积分: 0 3 下载量 125 浏览量 更新于2022-08-03 收藏 246KB PDF 举报
分位数回归是一种统计分析方法,它弥补了传统回归分析,即均值回归的不足。在传统的线性回归模型中,我们关注的是自变量x对因变量y的条件期望E(y|x)的影响,这实际上是在研究y的均值。然而,实际情况中,我们可能更关心x如何影响y的整个条件分布,而不仅仅是分布的均值。当y的条件分布不对称时,条件期望E(y|x)并不能全面反映分布特性。 分位数回归引入了条件分位数的概念,比如中位数、第一四分位数和第三四分位数,这些分位数提供了关于y条件分布的更多信息。通过估计这些分位数,我们可以更全面地理解x对y影响的分布情况。与均值回归使用残差平方和最小化目标不同,分位数回归采用残差绝对值的加权平均来最小化,这使得它对极端值不那么敏感,具有更好的稳健性。 总体分位数是随机变量Y的累积分布函数(CDF)的一个关键特征。对于连续型随机变量Y,其q分位数qy是满足P(Y≤qy)=q的值,它将总体分成两部分,一部分概率为q,另一部分为1-q。如果q=0.5,那么qy就是中位数。如果CDF严格单调递增,可以通过其逆函数找到分位数。 在回归分析中,条件分布|y x的累积分布函数记为| ( )yFx,其q分位数qy_x(条件分位数函数)满足P(y≤qy_x|x)=q。如果模型的扰动项满足特定条件,如同方差或乘积形式的异方差,条件分位数函数( )qyx将是x的线性函数。例如,在线性回归模型2~ iid(0,)yuuxx中,扰动项u的特性决定了( )qyx的线性形式。 当模型的扰动项同方差时,所有条件分位数函数的斜率相同,等于β,而截距依赖于分位数q。如果存在异方差,条件分位数函数的斜率会随着q的变化而变化,记为qβ。在实际应用中,如果无法得到总体分位数,可以使用样本分位数来估计。样本数据按照大小排序后,样本q分位数 ˆqy是满足P(1≤i≤n, Yi≤ ˆqy)=q的样本观测值的顺序位置。 总结来说,分位数回归是一种强大的工具,它允许我们不仅关注数据的均值,还关注整个分布,特别是对于非对称分布的数据。通过估计不同条件分位数,我们可以获得更丰富的信息,并且由于其对极端值的稳健性,它在处理异常值或分布尾部效应时特别有用。在实际建模时,可以考虑使用分位数回归来捕捉不同部分的效应,尤其是在金融、社会科学和许多其他领域。
艾斯·歪
  • 粉丝: 42
  • 资源: 342
上传资源 快速赚钱
voice
center-task 前往需求广场,查看用户热搜