概率密度估计与非参数回归.pdf_非线性模型参数估计资源-CSDN文库

概率密度

需积分: 13 162 浏览量 2020-01-01 15:48:13 上传评论 1 收藏 210KB PDF 举报

资源推荐

资源详情

资源评论

概率密度估计与非参数回归

曾焰

版本 1.0，最后修订于 2017-11-05

摘要

陈希孺等 [1] 第六章的内容摘要。

1 概率密度估计

1.1 几种重要的密度估计方法

1. 直方图法。这个方法可描述如下：假设随机变量 X 有密度 f ，并有 X 的独立同分布样本 X

，

· · · ，X

。选择一个适当的正数 h，把全直线分为一些长为 h 的区间。任取这些区间之一，记为 I。对

x ∈ I，我们有

f(x) ≈

P (X ∈ I)

≈



i=1

∈I}

� (1.1)

这一方法重要的是 h 的选择。h 太大了，平均化的作用突出了，而淹没了密度的细节部分。太小

了，则受随机性影响太大，而产生极不规则的形状。h 的选择无现成规则可循。实际操作中，我们可能

需要取一些不等长的区间，这样的直方图估计称为“Data-based”的直方图估计。

直方图估计的优点是简单易行，缺点是它不是连续函数（这可以通过适当地修匀来解决），且从统

计角度看一般说效率较低。例如，在这一方法下，每一区间中心部分密度估计较准，而边缘部分则较差。

2. Rosenblatt 法。为克服直方图法的一个缺点——对每个区间边缘部分密度值的估计较差，

Rosenblatt 在 1955 年提出了一个简单的改进。指定一个正数 h，对每个 x，定义 I



x −

, x +



，

并对密度函数 f 作如下估计

(x)

∆

= f

(x; X

, · · · , X

) =



i=1

∈I

}

(1.2)

Rosenblatt 法与直方图法不同之处仅在于，它事先不把分割区间定下来，而让区间随着要估计之点 x

跑，使 x 始终处在区间之中心位置，而获致较好的效果。理论上可以证明，从估计量与被估计量接近

的数量级上看，Rosenblatt 方法确实优于直方图法。

3. Parzen 的核估计。直观上可以设想：为估计 f (x)，与 x 靠近的样本，所起作用似应比远离 x

的样本要大些。这些在 Parzen 于 1962 年提出的核估计方法中都得到了体现。为介绍 Parzen 的思想，

我们先将 (1.2) 式变换一个形式，引进一个函数

W (x) = I

[

−

]

(x)�

1 概率密度估计 2

则 (1.2) 式可改写为

(x) =



i=1



x − X



�

W (·) 定义的是 R

上的均匀密度函数。Parzen 的推广即在于去掉这一特殊性，而容许 W 为一般的密

度函数。

定义 1.1. 设 K(·) 是 R

上的一个给定的概率密度函数，h

> 0 是一个同 n 有关的常数，定义

(x) =



i=1



x − X



� (1.3)

称 f

为总体未知密度 f 的一个核估计，K 为核函数，h

为窗宽。

在给定样本之后，一个核估计性能的好坏，取决于核及窗宽的选取是否适当。当 h

选得过大，由

于 x 经过压缩变换

x−X

之后使分布的主要部分的某些特征（如多峰性）被掩盖起来了，估计量有较

大偏差。如 h

太小，整个估计特别是尾部出现较大的干扰，从而有增大方差的趋势。因而在实际使用

核估计时，如何选取适当的宽度是一项很细致的工作。选择核 K 是否适当，同样要影响估计的精度。

原则上，我们可以对核 K 施加一定的限制，使得估计量与待估函数的偏差在一定意义下尽可能地小。

例如可以要求 K 有对称性，其一阶矩（关于密度 K）为零，具有有界性、连续性等等。在文献中，核

估计已成为密度估计的主要方法。

4. 最近邻估计。这一方法较适合于密度的局部估计。其要旨如下：设 X

，· · · ，X

是来自未知密

度 f 的样本。先选定一个同 n 有关的整数 k = k

，合于 1 ≤ k < n ，对固定的 x ∈ R

，记 a

(x) 为最

小的正数 a 使得 [x − a, x + a] 中至少包含 X

，· · · ，X

中的 k 个。定义

(x) =

(x)n

(1.4)

为 f(x) 的估计，称

为 f 的最近邻估计（简记为 N.N. 估计）。下面的引理说明：从整体看，N.N.

估计的性质与核估计有很大的不同。

引理 1.1. (1) 对固定 n 及 X

，· · · ，X

，

(x) 作为变元 x 的函数是处处连续的。

(2)

(x) 作为变元 x 的函数非概率密度，并且

(x) = O





,当 |x| → ∞。

特别地，我们有



(x)dx = ∞

引理1.1的性质（2）与待估 f 的尾部特征无关，因而对相当一类待估密度，估计

(x) 的尾部衰

减得太慢，从而

不适宜用作 f 的整体估计。下面的引理给出了

(x) 的分布。

引理 1.2. 对固定 x ∈ R

，n ≥ 1，有

P (a

(x) ≤ y) =



i=k

(y)(1 − p(y))

n−i

= nC

k−1

n−1



p(y)

k−1

(1 − t)

n−k

dt, y > 0,

这一定义考虑的是 X 为一维的情况。若 X 为 d 维，只须将 (1.3) 式中分母 nh

改为 nh

。

1 概率密度估计 3

其中

p(y) =



x+y

x−y

f(t)dt = P (x − y ≤ X ≤ x + y)�

如果令 K(x) =







, |x| < 1

0, |x| ≥ 1

，则可将 N.N. 估计改写为

(x) =

(x)



i=1



x − X

(x)



�

于是在单个点 x 上的 N.N. 估计与核估计差别不大，只有当同时考虑在几个点或者估计整个 f 时，这

两种方法才显示出差别。N.N. 估计由于计算上有某种方便之处，这种方法被广泛地用于模式识别及非

参数判别分析。

1.2 估计精度的度量

我们用 T

(x)

∆

= T

(x; X

, · · · , X

) 表示基于样本 X

，· · · ，X

的、对未知密度 f (x) 的任一估计。

由于 T

(x) 既同样本有关，又是考察点的函数，因而对固定的考察点 x，估计精度的一种自然测度为

MSE(T

(x)) = E

[(T

(x) − f(x))

] = (E

(x)] − f(x))

+ Var

(x)), (1.5)

称 (1.5) 为估计 T

的均方误差，其中 E

表示期望是在真分布为 f 时的计算。（1.5）右端是由两个部

分组成：第一项是偏差项，而第二项是估计的方差。要同时减少这两部分是困难的：通常，如降低偏

差，则方差有增大的趋向，反之亦然。例如当 T

(x) 为核估计时，有

(x)] =



K(y)f(x − h

y)dy,

Var

(x)] =



(y)f(x − h

y)dy −





K(y)f(x − h

y)dy



�

因而一个核估计的光滑程度只与光滑参数 h

有关（当核 K 已确定时），而与 n 无直接关系。

对于密度估计来说，更有实际意义的精度的度量应是整体性的测度。一个被广泛使用的整体测度

是积分均方误差（MISE）：

MISE(T

) = E





(x) − f(x))





MSE(T

(x))dx



(x)] − f(x))

dx +



Var

(x))dx

= 积分偏差平方和 + 积分方差

我们在前段对均方误差的分析，同样可施用于积分均方误差。对核估计来说，应该选择 h

使得相应的

核估计其 MISE 达到最小。

为便于计算及理论分析，我们可以通过泰勒展开，得到估计偏差及方差的渐进表达式。为简单计，

设 K 是对称密度函数，满足：



tK(t)dt = 0，k

∆



K(t)dt = 0，而 f 具有二阶有界连续导数且

′′

∈ L

)，h

∆

= h

→ 0，当 n → ∞。则有如下渐近公式：



(x)] − f(x))

dx ≈



′′

(x)]

dx,



Var

(x))dx ≈ (nh)

−1



(u)du�

剩余10页未读，继续阅读

评论收藏

内容反馈

jiaoruiqiang

粉丝: 0
资源: 1

概率密度估计与非参数回归.pdf

教材 应用非参数回归.pdf

非参数估计

现代非参数统计

论文研究-基于高斯回归的连续空间多智能体跟踪学习 .pdf

非参数回归模型在金融时间序列上的应用

论文研究-基于LASSO分位数回归的中期电力负荷概率密度预测方法.pdf

论文研究-基于Box-Cox变换分位数回归与负荷关联因素辨识的中长期概率密度预测.pdf

证券投资基金收益概率密度预测——基于神经网络分位数回归模型.pdf

论文研究-具有一阶自回归测量误差的步进加速退化可靠性分析.pdf

Excel公式与函数大辞典.宋翔(带书签高清文字版).pdf

人工智能学习算法分类.pdf

sklearn0.19中文文档

论文研究-基于贝叶斯匹配追踪的SAR图像重构.pdf

论文研究-一种邻域自适应半监督局部Fisher判别分析算法.pdf

Khan Academy_ Statistics[229].pdf

论文研究-基于改进支持向量机的快速稳健代理模型研究.pdf

什么是人工智能的核心技术？.pdf

论文研究 - 公用事业股收益波动对上下市场的不对称响应和放松管制

Adaptive Gaussian Filtering:使用高斯核的机器学习。-开源

ChatGPT教程（终极版）最全整理

yolov8调用zed相机实现三维测距（版本一）

基于Python+pytorch的图像处理+附完整代码图像处理，能够轻松实现图像的读取、显示、裁剪等还有机器学习等操作

博客中Kmeans以及FCM算法数据（免积分）

hugging face的models-openai-clip-vit-large-patch14文件夹

神经网络回归预测--气温数据集

XGBoost+LightGBM+LSTM-光伏发电量预测

Mathwork+Matlab+编程手册

Stable-Diffusion WEBUI 简体中文语言包（2023.05.30更新）

最新资源

教材应用非参数回归.pdf