【管理运筹学】第 8 章 | 动态规划(2,动态规划的基本思想)

文章目录

  • 引言
    • 2.2 动态规划的基本思想
  • 写在最后


引言

承接前文,介绍完基本概念后,我们来学习动态规划的基本思想,用上一篇文章的最短路问题来配合说明。


2.2 动态规划的基本思想

最短路问题中的网络如下图所示,从 A 到 E 可以分成 4 段,第一段从 A 到 B ,有两条路,如果选择去 B2 作为此阶段的决策,则下一阶段的起点就是 B2 ,此时又有两种选择,以此类推,可以求出一个决策序列。每一段选择不同,得到的序列便不同,我们希望求出一个最优决策,此决策对应的路线为 A 到 E 的最短路线。

在这里插入图片描述
显然,通过求出所有路线的距离进行比较,找出最短路对于本例是可行的,但是当路径数增加,这种穷举法的计算量会大大增加。下面介绍动态规划方法,可以帮助我们更好地求解该问题。

动态规划方法基于贝尔曼(R. Bellman)等人提出的最优化原理,这个最优化原理指出:一个过程的最优策略具有这样的性质,即无论初始状态或初始决策如何,对于先前决策所形成的状态而言,其以后的所有决策须构成最优策略。

将该原理应用到最短路问题中,即从 A 到 E 的最短路线若经过 s k s_k sk 点,则此路线由 s k s_k sk 点到 E 的部分,必是由 s k s_k sk 点到 E 点的最短路线。

如此,我们便可以从最后一个状态,即 s 4 s_4 s4 开始,向最初状态不断递推求解,最终得到从 A 到 E 的最短路线。

第一步: k = 4 k=4 k=4 ,此时状态变量集合为 S 4 = { D 1 , D 2 , D 3 } S_4=\{D1,D2,D3\} S4={D1,D2,D3} ,那么每个取值对应的指标函数分别为 f 4 ( D 1 ) = 3 , f 4 ( D 2 ) = 4 , f 4 ( D 3 ) = 3 f_4(D1)=3,f_4(D2)=4,f_4(D3)=3 f4(D1)=3,f4(D2)=4,f4(D3)=3

第二步: k = 3 k=3 k=3 ,此时状态变量可取值为 S 3 = { C 1 , C 2 , C 3 , C 4 } S_3=\{C1,C2,C3,C4\} S3={C1,C2,C3,C4} ,如果取 C 1 C1 C1 ,则其到终点有两条路线,需加以比较,有 f 3 ( C 1 ) = m i n { d ( C 1 , D 1 ) + f 4 ( D 1 ) d ( C 1 , D 2 ) + f 4 ( D 2 ) } = m i n { 5 + 3 6 + 4 } = 8 f_3(C1)=min\begin{Bmatrix} d(C1,D1)+f_4(D1) \\ d(C1,D2)+f_4(D2)\end{Bmatrix}=min\begin{Bmatrix} 5+3 \\ 6+4\end{Bmatrix}=8 f3(C1)=min{d(C1,D1)+f4(D1)d(C1,D2)+f4(D2)}=min{5+36+4}=8 说明从 C1 到 E 最短距离为 8 ,路径为 C 1 → D 1 → E C1\to D1 \to E C1D1E ,此阶段决策为 u 3 ∗ ( C 1 ) = D 1 u^*_3(C_1)=D1 u3(C1)=D1

若取 C 2 C2 C2 ,只有一条路径,即 C 2 → D 1 → E C_2\to D1\to E C2D1E ,则 f 3 ( C 2 ) = d ( C 2 , D 1 ) + f 4 ( D 1 ) = 8 f_3(C2)=d(C2,D1)+f_4(D1)=8 f3(C2)=d(C2,D1)+f4(D1)=8 ,相应决策为 u 3 ∗ ( C 2 ) = D 1 u^*_3(C2)=D1 u3(C2)=D1 。同理,可求出 f 3 ( C 3 ) = d ( C 3 , D 3 ) + f 4 ( D 3 ) = 11 , u 3 ∗ ( C 3 ) = D 3 f_3(C3)=d(C3,D3)+f_4(D3)=11,u^*_3(C3)=D3 f3(C3)=d(C3,D3)+f4(D3)=11,u3(C3)=D3 f 3 ( C 4 ) = d ( C 3 , D 3 ) + f 4 ( D 3 ) = 6 , u 3 ∗ ( C 4 ) = D 3 f_3(C4)=d(C3,D3)+f_4(D3)=6,u^*_3(C4)=D3 f3(C4)=d(C3,D3)+f4(D3)=6,u3(C4)=D3 第三步: k = 2 k=2 k=2 ,此时状态变量集合 S 2 = { B 1 , B 2 } S_2=\{B1,B2\} S2={B1,B2} ,有 f 2 ( B 1 ) = m i n { d ( B 1 , C 1 ) + f 3 ( C 1 ) d ( B 1 , C 2 ) + f 3 ( C 2 ) d ( B 1 , C 3 ) + f 3 ( C 3 ) } = m i n { 1 + 8 6 + 8 3 + 11 } = 9 , u 2 ∗ ( B 1 ) = C 1 f_2(B1)=min\begin{Bmatrix} d(B1,C1)+f_3(C1) \\ d(B1,C2)+f_3(C2) \\ d(B1,C3)+f_3(C3) \end{Bmatrix}=min\begin{Bmatrix} 1+8 \\ 6+8 \\ 3+11 \end{Bmatrix}=9,u^*_2(B1)=C1 f2(B1)=min d(B1,C1)+f3(C1)d(B1,C2)+f3(C2)d(B1,C3)+f3(C3) =min 1+86+83+11 =9,u2(B1)=C1 f 2 ( B 2 ) = m i n { d ( B 2 , C 2 ) + f 3 ( C 2 ) d ( B 2 , C 4 ) + f 3 ( C 4 ) } = m i n { 8 + 8 4 + 6 } = 10 , u 2 ∗ ( B 2 ) = C 4 f_2(B_2)=min\begin{Bmatrix} d(B2,C2)+f_3(C2) \\ d(B2,C4)+f_3(C4)\end{Bmatrix}=min\begin{Bmatrix} 8+8 \\ 4+6\end{Bmatrix}=10,u^*_2(B_2)=C4 f2(B2)=min{d(B2,C2)+f3(C2)d(B2,C4)+f3(C4)}=min{8+84+6}=10,u2(B2)=C4 第四步: k = 1 k=1 k=1 ,此时只有一个状态 A ,有 f 1 ( A ) = m i n { d ( A , B 1 ) + f 2 ( B 1 ) d ( A , B 2 ) + f 2 ( B 2 ) } = m i n { 5 + 9 3 + 10 } = 13 , u 1 ∗ ( A ) = B 2 f_1(A)=min\begin{Bmatrix} d(A,B1)+f_2(B1) \\ d(A,B2)+f_2(B2)\end{Bmatrix}=min\begin{Bmatrix} 5+9 \\ 3+10 \end{Bmatrix}=13,u^*_1(A)=B2 f1(A)=min{d(A,B1)+f2(B1)d(A,B2)+f2(B2)}=min{5+93+10}=13,u1(A)=B2 即 A 到 E 的最短距离为 13 ,按照计算顺序反推可得到最优决策序列 { u k ∗ } \{u^*_k\} {uk} ,为 u 1 ∗ ( A ) = B 2 , u 2 ∗ ( B 2 ) = C 4 , u 3 ∗ ( C 4 ) = D 3 , u 4 ∗ ( D 3 ) = E u^*_1(A)=B2,u^*_2(B_2)=C4,u^*_3(C4)=D3,u^*_4(D3)=E u1(A)=B2,u2(B2)=C4,u3(C4)=D3,u4(D3)=E ,则最优路线为 A → B 2 → C 4 → D 3 → E A\to B2 \to C4 \to D3 \to E AB2C4D3E 从上述求解过程中可以看出,第 k k k 阶段和第 k + 1 k+1 k+1 段都利用了如下关系 { f k ( s k ) = m i n { d k ( s k , u k ) + f k + 1 ( s k + 1 ) } , k = 4 , 3 , 2 , 1 ( 1.1 ) f 5 ( s 5 ) = 0 ( 1.2 ) \begin{cases} \ f_k(s_k)=min\{d_k(s_k,u_k)+f_{k+1}(s_{k+1})\}, & k=4,3,2,1(1.1)\\ \ f_5(s_5)=0 (1.2) \end{cases} { fk(sk)=min{dk(sk,uk)+fk+1(sk+1)}, f5(s5)=01.2k=4,3,2,11.1 注:状态转移方程为 s k + 1 = u k s_{k+1}=u_k sk+1=uk

这种递推关系称为动态规划的基本方程,式(1.2)为边界条件。

因此,可总结出动态规划方法的基本思想总结为:

  1. 将多阶段问题决策过程划分阶段,恰当地选取状态变量、决策变量及定义最优指标函数,从而把问题化为一族同类型的子问题,然后逐个求解。
  2. 求解时从最后一个阶段开始,逆方向进行,逐段递推寻优。在每个子问题求解时,都要使用它前面已经求出的子问题的最优结果,最后一个子问题的最优解就是整个问题的最优解。
  3. 动态规划方法是既把当前一段与未来各段分开,又把当前效益和未来效益结合起来考虑的一种最优化方法,因此每段的决策选取都是从全局考虑的,与该段的最优选择一般不同。

写在最后

通过分阶段求解最短路问题,动态规划的思想已经很好地体现了,下一篇文章我们来看看动态规划的数学模型及其求解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/135554.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

零基础学前端(四)重点讲解 CSS

1. 该篇适用于从零基础学习前端的小白 2. 初学者不懂代码得含义也要坚持模仿逐行敲代码,以身体感悟带动头脑去理解新知识 3. 初学者切忌,不要眼花缭乱,不要四处找其它文档,要坚定一个教授者的方式,将其学通透&#xff…

SpringMVC之自定义注解

一.什么是SpringMVC之自定义注解 二.Java注解简介 Java注解分类 JDK元注解 三.自定义注解简介 自定义注解的分类 四.自定义注解的基本案例 案例一(获取类与方法上的注解值) 案例二(获取类属性上的注解属性值) 案例三&a…

MyBatis笔记

Mybatis简介 MyBatis历史 MyBatis最初是Apache的一个开源项目iBatis, 2010年6月这个项目由Apache Software Foundation迁移到了Google Code。随着开发团队转投Google Code旗下,iBatis3.x正式更名为MyBatis。代码于2013年11月迁移到GithubiBatis一词来源于“intern…

【数据结构与算法】不就是数据结构

前言 嗨喽小伙伴们你们好呀,好久不见了,我已经好久没更新博文了!之前因为实习没有时间去写博文,现在已经回归校园了。我看了本学期的课程中有数据结构这门课程(这么课程特别重要),因为之前学过一点&#xf…

数据结构与算法(三)——递归

一、递归的概念 递归就是方法自己调用自己,每次调用时传入不同的变量。 递归有助于编程者解决复杂的问题,同时可以让代码变得简洁。 1.1 递归机制 递归调用规则: 1>当程序执行到一个方法时,就会开辟一个独立的空间&#xff0…

vr飞机驾驶舱模拟流程3D仿真演示加大航飞安全法码

众所周知,航空航天飞行是一项耗资大、变量参数很多、非常复杂的系统工程,因此可利用虚拟仿真技术经济、安全及可重复性等特点,进行飞行任务或操作的模拟,以代替某些费时、费力、费钱的真实试验或者真实试验无法开展的场合&#xf…

2023 Google 开发者大会:Web平台新动向

目录 前言一、Open in WordPress playground二、WebGPU三、新的核心 Web 指标INP四、Webview1、Custom Tabs2、JavaScriptEngine 五、Passkeys六、View Transitions API七、Google Chrome开发者工具优化1、覆盖HTTP的响应标头2、改变stack trance 八、Baseline总结 前言 在前不…

攻防世界-WEB-easyupload

1.新建.user.ini文件,内容如下 GIF89a auto_prepend_filea.jpg 2.上传该文件,并用burp抓包,将Content-Type: application/octet-stream修改为 Content-Type: image/jpg 3.放包,结果如下 4. 新建a.txt文件,内容为 GIF89…

插槽指的是什么?插槽的基础用法体验

什么是插槽 插槽(Slot)是 vue 为组件的封装者提供的能力。允许开发者在封装组件时&#xff0c;把不确定的、希望由用户指定的部分定义为插槽。 <template><p>这是MyCom1组件的第1个p标签</p><&#xff01;--通过slot标签&#xff0c;为用户预留内容占位符…

蓝牙核心规范(V5.4)10.1-BLE 入门笔记(1)

ble 规范 深入了解蓝牙LE需要熟悉相关的规格。蓝牙LE的架构、程序和协议由一项关键规范完全定义,称为蓝牙核心规范。产品如何使用蓝牙以实现互操作性由两种特殊类型称为配置文件和服务的规范集合所涵盖。图1展示了BLE规范类型及其相互关系。 1.1 蓝牙核心规范 蓝牙核心规范是…

html+js写一个可编辑的元素 支持直接向上粘贴文本或图片

有一说一来讲 CSDN 博客的编辑器还是非常厉害的 能够完美设配图片与文字的粘贴与输入 但其实 如果做个捡漏版的 js也可以完成 但这里 为了方便 我选择了vue2的环境 参考代码如下 <template><div class"editable-div" contenteditable"true" past…

WavJourney:进入音频故事情节生成世界的旅程

推荐&#xff1a;使用 NSDT场景编辑器快速搭建3D应用场景 若要正确查看音频生成的强大功能&#xff0c;请考虑以下方案。我们只需要提供一个简单的指令&#xff0c;描述场景和场景设置&#xff0c;模型就会生成一个扣人心弦的音频脚本&#xff0c;突出与原始指令的最高上下文相…

小米6/6X/米8/米9手机刷入鸿蒙HarmonyOS.4.0系统-刷机包下载-遥遥领先

小米手机除了解锁root权限&#xff0c;刷GSI和第三方ROM也是米粉的一大爱好&#xff0c;这不&#xff0c;在华为发布了HarmonyOS.4.0系统后不久&#xff0c;我们小米用户也成功将自己的手机干山了HarmonyOS.4.0系统。虽然干上去HarmonyOS.4.0系统目前BUG非常多&#xff0c;根本…

数仓主题域和数据域、雪花模型,星型模型和星座模型

数仓模型和领域划分 一、主题域和数据域的差别二、雪花模型&#xff0c;星座模型和星型模型 一、主题域和数据域的差别 明确数据域作为数仓搭建的重要一环&#xff0c;能够让数仓的数据便于管理和应用。 数据域和主题域都是数据仓库中的重要概念&#xff0c;但含义略有不同&am…

【Pinia】Pinia的概念、优势及使用方式

学习公司的项目&#xff0c;发现用到了Pinia&#xff0c;于是上网学习了一下&#xff0c;发现了一篇比较优秀的文章&#xff0c;于是将极少部分放到此记录学习&#xff0c;原文链接在末尾。 是什么 官网解释&#xff1a; Pinia 是 Vue 的存储库&#xff0c;它允许您跨组件/页…

2023年中国场馆产业研究报告

第一章 行业综述 1.1 定义与分类 场馆&#xff0c;作为一个多元化和充满活力的行业&#xff0c;为人们提供了一个为不同目的而聚集的空间。无论是为了活动、表演、展览还是聚会&#xff0c;场馆都在为社区的社会、文化和经济建设做出了不可或缺的贡献。 场馆是一个为举办各类…

VR全景展示的功能有哪些?你了解多少?

VR全景展示作为一种全新的视觉体验技术&#xff0c;能够为人们带来强烈的视觉效果以及沉浸式的观感&#xff0c;在旅游、房地产、车展、博物馆等都有着十分广泛的应用。这种富媒体技术&#xff0c;具有很好的交互性和沉浸感&#xff0c;能够带给大家更好的体验&#xff0c;那么…

uni-app实现web-view图片长按下载

<template><view><web-view :webview-styles"webviewStyles" :src"webUrl"></web-view></view> </template> uniapp的web-view中图片无法长按保存&#xff0c;IOS下是正常的&#xff0c;但是Android下长按无反应 解…

如何统计iOS产品不同渠道的下载量?

一、前言 在开发过程中&#xff0c;Android可能会打出来很多的包&#xff0c;用于标识不同的商店下载量。原来觉得苹果只有一个商店&#xff1a;AppStore&#xff0c;如何做出不同来源的统计呢&#xff1f;本篇文章就是告诉大家如何做不同渠道来源统计。 二、正文 先看一下苹…

【C++模拟实现】map、set容器的模拟实现

【C模拟实现】map、set容器的模拟实现 目录 【C模拟实现】map、set容器的模拟实现map、set模拟实现的代码&#xff08;insert部分&#xff09;部分一&#xff1a;红黑树的迭代器以及红黑树部分二&#xff1a;对set进行封装部分三&#xff1a;对map进行封装 遇到的问题以及解决方…