Matlab
求解偏微分的代码o-变分梯度下降
这项研究寻找某种方法来推广经典的梯度下降,但不是将其应用于函数,而是将其应用于泛函(最优控制基本上是最小化具有限制的泛函)。
事实上,我们正在将它应用于特定类别的泛函。
特别是,我们正在寻找以下形式的函数的最小值:
当我们想要优化系统时,就会出现与控制理论的联系,例如,完全反馈可线性化:我们可以找到与之前所示形式等效的成本函数。
我们将问题简化为两次偏微分方程。
一个是系统演化的时间,另一个是“虚拟时间”,即类似于经典梯度下降迭代的连续迭代版本。
与纯数学的朋友交谈时,他们告诉我这个概念实际上是“叶子”,因此它更接近纯数学而不是工程学。
偏微分方程表示如下:
其中
t
为系统时间,
tau为系统虚拟时间。
事实上我们有:
自述文件中的最后一张图片显示成本始终在下降。
所以我们可以通过将tau驱动到无穷大来找到最优解,至少是局部的,因为它是初始条件相关的。
Matlab
代码中提供了示例。
在这种情况下,我们正在使用这种方法解决
LQR
问题,以了解该偏微分方程的行为。
我们只使用带有
LQR
的单个积分器。
然而,通过获得一些快速的方法来
评论0
最新资源