6.设函数f(x)在x0处可导,且在x处取得极值,则函数的导数
F’(x0)=0。
7.以二元函数z=f(x,y)为例,固定其中的y,把x看做唯一的自变
量,此时,函数对x的导数称为二元函数z=f(x,y)对x的偏导数。
8.为了把原带约束的极值问题转换为无约束的极值问题,一般引
入拉格朗日乘子,建立拉格朗日函数,然后对拉格朗日函数求
导,令求导结果等于0,得到极值。
1.什么是熵
熵用来表示随机变量的不确定性。一个系统越是有序,信息熵就越
低;反之,一个系统越是混乱,信息熵就越高。所以说,信息熵可以被
认为是系统有序化程度的一个度量。
1.1术语定义
熵
:
如果一个随机变量X的可能取值为X = {x1, x2,…, xk},其概率分
布为P(X = xi) = pi(i = 1,2, ..., n),则随机变量X的熵定义为:
把最前面的负号放到最后,便成了:
联
合
熵
:两个随机变量X,Y的联合分布,可以形成联合熵Joint
Entropy,用H(X,Y)表示。
条
件
熵
:在随机变量X发生的前提下,随机变量Y发生所新带来的熵定义
为Y的条件熵,用H(Y|X)表示,用来衡量在已知随机变量X的条件下随机
变量Y的不确定性。
且有此式子成立:H(Y|X) =H(X,Y) – H(X),整个式子表示(X,Y)
发生所包含的熵减去X单独发生包含的熵。推导如下:
评论0