"第9章多阶段动态规划决策"
本章节主要讲述了多阶段决策与动态规划的基本概念和方程。多阶段决策是指决策过程分为若干个互相联系的阶段,在每一个阶段都需要作出决策,从而使整个过程达到最好的效果。多阶段决策过程可以分为离散确定性、连续确定性、离散随机性和连续随机性四种类型。
动态规划是运筹学的一个分支,它是解决多阶段决策过程最优化的一种数学方法。动态规划的基本思想是从最后一段开始,用由后向前逐步递推的方法,从终点逐段向始点方向寻找最优路经的方法。
在多阶段决策过程中,需要确定三个要素:阶段、状态和决策。阶段是根据问题的时间和空间的自然特征进行划分,用 k 表示。状态是每个阶段开始所处的自然状况或客观条件,用 Sk 表示。决策是当过程处于某一阶段的某个状态时,可以作出的决定,用 dk (Sk ) 表示。
指标函数是当过程处于某一阶段某个状态的即时所得,用 Rk (Sk ,dk ) 表示。动态规划的基本概念和方程可以表示为:
f k(Sk )= min/max{Rk(Sk, dk )+ f k+1(Sk+1 )} k = n, n-1, ……, 1
f n+1(Sn+1 )=0
贝尔曼(R.Bellman)的最优性原理是:“任何前一阶段决策结果所得的状态,应能使其同其余阶段的决策共同构成最优决策。”
在解决多阶段决策问题时,可以使用“标号法”来寻找最短路线。例如,在解决最短路线问题时,可以使用“标号法”来寻找从起点到终点的最短路线。
确定性多阶段决策是指在决策过程中,所有的状态和决策结果都是确定的。例如,在解决新产品定价问题时,可以使用动态规划来确定最优的定价策略。
随机性多阶段决策是指在决策过程中,存在不确定性的因素。例如,在解决采购问题时,需要考虑价格的波动和概率分布。可以使用动态规划来确定最优的采购策略。
本章节对多阶段决策与动态规划的基本概念和方程进行了详细的介绍,并提供了多个实例来帮助读者更好地理解这些概念。