第26章-分位数回归1
需积分: 0 68 浏览量
更新于2022-08-03
收藏 246KB PDF 举报
分位数回归是一种统计分析方法,它弥补了传统回归分析,即均值回归的不足。在传统的线性回归模型中,我们关注的是自变量x对因变量y的条件期望E(y|x)的影响,这实际上是在研究y的均值。然而,实际情况中,我们可能更关心x如何影响y的整个条件分布,而不仅仅是分布的均值。当y的条件分布不对称时,条件期望E(y|x)并不能全面反映分布特性。
分位数回归引入了条件分位数的概念,比如中位数、第一四分位数和第三四分位数,这些分位数提供了关于y条件分布的更多信息。通过估计这些分位数,我们可以更全面地理解x对y影响的分布情况。与均值回归使用残差平方和最小化目标不同,分位数回归采用残差绝对值的加权平均来最小化,这使得它对极端值不那么敏感,具有更好的稳健性。
总体分位数是随机变量Y的累积分布函数(CDF)的一个关键特征。对于连续型随机变量Y,其q分位数qy是满足P(Y≤qy)=q的值,它将总体分成两部分,一部分概率为q,另一部分为1-q。如果q=0.5,那么qy就是中位数。如果CDF严格单调递增,可以通过其逆函数找到分位数。
在回归分析中,条件分布|y x的累积分布函数记为| ( )yFx,其q分位数qy_x(条件分位数函数)满足P(y≤qy_x|x)=q。如果模型的扰动项满足特定条件,如同方差或乘积形式的异方差,条件分位数函数( )qyx将是x的线性函数。例如,在线性回归模型2~ iid(0,)yuuxx中,扰动项u的特性决定了( )qyx的线性形式。
当模型的扰动项同方差时,所有条件分位数函数的斜率相同,等于β,而截距依赖于分位数q。如果存在异方差,条件分位数函数的斜率会随着q的变化而变化,记为qβ。在实际应用中,如果无法得到总体分位数,可以使用样本分位数来估计。样本数据按照大小排序后,样本q分位数 ˆqy是满足P(1≤i≤n, Yi≤ ˆqy)=q的样本观测值的顺序位置。
总结来说,分位数回归是一种强大的工具,它允许我们不仅关注数据的均值,还关注整个分布,特别是对于非对称分布的数据。通过估计不同条件分位数,我们可以获得更丰富的信息,并且由于其对极端值的稳健性,它在处理异常值或分布尾部效应时特别有用。在实际建模时,可以考虑使用分位数回归来捕捉不同部分的效应,尤其是在金融、社会科学和许多其他领域。

艾斯·歪
- 粉丝: 42
- 资源: 342
最新资源
- DeepSeek自学手册:从理论到实践.pdf
- DeepSeek中小学生使用手册.pdf
- 把握DeepSeek时刻,携手同行 华为昇腾AI解决方案汇报.pdf
- 如何用DeepSeek打造抖音内容营销铁三角.pdf
- 计算机行业:DeepSeek+DeepResearch应用.pdf
- 快速配置各种程序支持环境
- 《3D打印基础实务》毕业设计之3D打印成型原理写字字帖.ppt
- ai大模型应用案例.pdf
- 《SQLServer数据库应用基础教程》第五章SQLServer的数据完整性.ppt
- deepseek使用教程-Deepseek 高效使用指南.pdf
- 电力电子硬件在仿真技术中运用.pdf
- 一文读懂Elasticsearch之单机模式搭建
- 计算机考证理论全.pdf
- 微控制器固件包_STM32CubeU5_开发工具_1741142576.zip
- 电路设计_Kicad-STM32_库_开发工具_1741144465.zip
- atihkoseoglu_STM32F4-DISCOVE_1741144102.zip