第26章-分位数回归1
需积分: 0 125 浏览量
更新于2022-08-03
收藏 246KB PDF 举报
分位数回归是一种统计分析方法,它弥补了传统回归分析,即均值回归的不足。在传统的线性回归模型中,我们关注的是自变量x对因变量y的条件期望E(y|x)的影响,这实际上是在研究y的均值。然而,实际情况中,我们可能更关心x如何影响y的整个条件分布,而不仅仅是分布的均值。当y的条件分布不对称时,条件期望E(y|x)并不能全面反映分布特性。
分位数回归引入了条件分位数的概念,比如中位数、第一四分位数和第三四分位数,这些分位数提供了关于y条件分布的更多信息。通过估计这些分位数,我们可以更全面地理解x对y影响的分布情况。与均值回归使用残差平方和最小化目标不同,分位数回归采用残差绝对值的加权平均来最小化,这使得它对极端值不那么敏感,具有更好的稳健性。
总体分位数是随机变量Y的累积分布函数(CDF)的一个关键特征。对于连续型随机变量Y,其q分位数qy是满足P(Y≤qy)=q的值,它将总体分成两部分,一部分概率为q,另一部分为1-q。如果q=0.5,那么qy就是中位数。如果CDF严格单调递增,可以通过其逆函数找到分位数。
在回归分析中,条件分布|y x的累积分布函数记为| ( )yFx,其q分位数qy_x(条件分位数函数)满足P(y≤qy_x|x)=q。如果模型的扰动项满足特定条件,如同方差或乘积形式的异方差,条件分位数函数( )qyx将是x的线性函数。例如,在线性回归模型2~ iid(0,)yuuxx中,扰动项u的特性决定了( )qyx的线性形式。
当模型的扰动项同方差时,所有条件分位数函数的斜率相同,等于β,而截距依赖于分位数q。如果存在异方差,条件分位数函数的斜率会随着q的变化而变化,记为qβ。在实际应用中,如果无法得到总体分位数,可以使用样本分位数来估计。样本数据按照大小排序后,样本q分位数 ˆqy是满足P(1≤i≤n, Yi≤ ˆqy)=q的样本观测值的顺序位置。
总结来说,分位数回归是一种强大的工具,它允许我们不仅关注数据的均值,还关注整个分布,特别是对于非对称分布的数据。通过估计不同条件分位数,我们可以获得更丰富的信息,并且由于其对极端值的稳健性,它在处理异常值或分布尾部效应时特别有用。在实际建模时,可以考虑使用分位数回归来捕捉不同部分的效应,尤其是在金融、社会科学和许多其他领域。
艾斯·歪
- 粉丝: 42
- 资源: 342
最新资源
- 声纳视频中石头目标检测及计数的Python和Matlab实现
- Snipaste-32位便携版
- IP102数据集,使用yolov7标注,18975张原图,图片可查看https://backend.blog.csdn.net/article/details/144620956
- 漂亮的收款打赏要饭网HTML页面源码
- IP102数据集,使用coco json标注,18975张原图,图片可查看https://backend.blog.csdn.net/article/details/144620956
- golang-案例与项目
- 上市公司-外资持股数据(2005-2023年).zip
- 马检测6-YOLO(v7至v11)、COCO、CreateML、Paligemma、TFRecord、VOC数据集合集.rar
- IP102数据集,使用pasical voc xml标注,18975张原图,图片可查看https://backend.blog.csdn.net/article/details/144620956
- 改进多目标粒子群储能选址定容matlab 采用matlab编程得到33节点系统改进多目标储能选址定容方案,采用基于信息熵的序数偏好法(TOPSIS)求解储能的最优接入方案,程序运行稳定,注释清楚 这
- 简单圣诞树的c语言编程代码
- Python Celery分布式异步任务队列详解与应用
- kafka-manager kafka控制台
- 一体式除尘砂带抛光机sw16可编辑全套技术资料100%好用.zip
- 用1位触发器实现4位寄存器
- 含分布式电源的IEEE33节点配电网的潮流计算程序,程序考虑了风光接入下的潮流计算问题将风光等效为PQV PI等节点处理,采用牛拉法开展潮流计算,而且程序都有注释 –以下内容属于A解读,有可能是一本正