八、动态规划法 5l(NX
jP"='6Vrw
经常会遇到复杂问题不能简单地分解成几个子问题,而会分解出一系列的子问题。简单地采用把大问题分解成子问题,并综合子问题的解导出大问题的解的方法,问题求解耗时会按问题规模呈幂级数增加。 _"";SqVB
为了节约重复求相同子问题的时间,引入一个数组,不管它们是否对最终解有用,把所有子问题的解存于该数组中,这就是动态规划法所采用的基本方法。以下先用实例说明动态规划方法的使用。 _Nq7_iT0
【问题】 求两字符序列的最长公共字符子序列 Y)v_O_`
问题描述:字符序列的子序列是指从给定字符序列中随意地(不一定连续)去掉若干个字符(可能一个也不去掉)后所形成的字符序列。令给定的字符序列X=“x0,x1,…,xm-1”,序列Y=“y0,y1,…,yk-1”是X的子序列,存在X的一个严格递增下标序列<i0,i1,…,ik-1>,使得对所有的j=0,1,…,k-1,有xij=yj。例如,X=“ABCBDAB”,Y=“BCDB”是X的一个子序列。 -u'BK@;
给定两个序列A和B,称序列Z是A和B的公共子序列,是指Z同是A和B的子序列。问题要求已知两序列A和B的最长公共子序列。 \>XkK<ye
如采用列举A的所有子序列,并一一检查其是否又是B的子序列,并随时记录所发现的子序列,最终求出最长公共子序列。这种方法因耗时太多而不可取。 K0?:?>*b#
考虑最长公共子序列问题如何分解成子问题,设A=“a0,a1,…,am-1”,B=“b0,b1,…,bm-1”,并Z=“z0,z1,…,zk-1”为它们的最长公共子序列。不难证明有以下性质: L[:b\O/p,
(1) 如果am-1=bn-1,则zk-1=am-1=bn-1,且“z0,z1,…,zk-2”是“a0,a1,…,am-2”和“b0,b1,…,bn-2”的一个最长公共子序列; y 4jelg
(2) 如果am-1!=bn-1,则若zk-1!=am-1,蕴涵“z0,z1,…,zk-1”是“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一个最长公共子序列; 0j|JyS:}G
(3) 如果am-1!=bn-1,则若zk-1!=bn-1,蕴涵“z0,z1,…,zk-1”是“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一个最长公共子序列。 &!FWo@
这样,在找A和B的公共子序列时,如有am-1=bn-1,则进一步解决一个子问题,找“a0,a1,…,am-2”和“b0,b1,…,bm-2”的一个最长公共子序列;如果am-1!=bn-1,则要解决两个子问题,找出“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一个最长公共子序列和找出“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一个最长公共子序列,再取两者中较长者作为A和B的最长公共子序列。 A 4|a{\|$
定义c[j]为序列“a0,a1,…,ai-2”和“b0,b1,…,bj-1”的最长公共子序列的长度,计算c[j]可递归地表述如下: gkDlh{
(1)c[j]=0 如果i=0或j=0; 0V:PRq;v0
(2)c[j]= c[i-1][j-1]+1 如果I,j>0,且a[i-1]=b[j-1]; L9)nRV8
(3)c[j]=max(c[j-1],c[i-1][j]) 如果I,j>0,且a[i-1]!=b[j-1]。 2r&T.
按此算式可写出计算两个序列的最长公共子序列的长度函数。由于c[j]的产生仅依赖于c[i-1][j-1]、c[i-1][j]和c[j-1],故可以从c[m][n]开始,跟踪c[j]的产生过程,逆向构造出最长公共子序列。细节见程序。 HBnnIbEtF'
# include <stdio.h> Vam4/6
# include <string.h> 8L*P!j9`EY
# define N 100 [P23.`G~J
char a[N],b[N],str[N]; mC(q8%/;
tO^KCnL
int lcs_len(char *a, char *b, int c[ ][ N]) Od:,r
{ int m=strlen(a), n=strlen(b), i,j; `[Xff24(eb
for (i=0;i<=m;i++) c[0]=0; n$T'gX#5
for (i=0;i<=n;i++) c[0]=0; n XOJ
for (i=1;i<=m;i++) :Vf :_;
for (j=1;j<=m;j++) Jk!*j
if (a[i-1]==b[j-1]) H|0GRjC
c[j]=c[i-1][j-1]+1; r/vRaOg>X
else if (c[i-1][j]>=c[j-1]) oopACE>
c[j]=c[i-1][j]; >~sAa+Oxi
else ,!s;o6|*y
c[j]=c[j-1]; 6U`yf&D
return c[m][n]; sSMcF[]@2I
} ED={OZD8
C"P40VQoo
char *buile_lcs(char s[ ],char *a, char *b) O+o1R24JI
{ int k, i=strlen(a), j=strlen(b); >wpC45n)9N
k=lcs_len(a,b,c); [l2ds:
s[k]=’\0’; QM
}TPE
while (k>0) crt
)}L8-
if (c[j]==c[i-1][j]) i--; Q~A25Jf.
else if (c[j]==c[j-1]) j--; S6r$n
else { s[--k]=a[i-1]; DhwFD8tT
i--; j--; .(0'l@#fT
} sacaL4[_<
return s; ^Z{W1uYi
} 8)D5loS
9o]h}Xc
void main() x05yU
{ printf (“Enter two string(<%d)!\n”,N); p<2A4="&
scanf(“%s%s”,a,b); pUs s_3
printf(“LCS=%s\n”,build_lcs(str,a,b)); /^kZ}}9baU
} Ls#=R
1、动态规划的适用条件 rVx%"_'*-
任何思想方法都有一定的局限性,超出了特定条件,它就失去了作用。同样,动态规划也并不是万能的。适用动态规划的问题必须满足最优化原理和无后效性。 EhkvC>y
(1)最优化原理(最优子结构性质) #l6L7u0~wC
最优化原理可这样阐述:一个最优化策略具有这样的性质,不论过去状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。简而言之,一个最优化策略的子策略总是最优的。一个问题满足最优化原理又称其具有最优子结构性质。 ]e'Ol$3U9=
*.UM[Wo
图2 \)=X=yn2
例如图2中,若路线I和J是A到C的最优路径,则根据最优化原理,路线J必是从B到C的最优路线。这可用反证法证明:假设有另一路径J’是B到C的最优路径,则A到C的路线取I和J’比I和J更优,矛盾。从而证明J’必是B到C的最优路径。 _Kp{b"G
最优化原理是动态规划的基础,任何问题,如果失去了最优化原理的支持,就不可能用动态规划方法计算。根据最优化原理导出的动态规划基本方程是解决一切动态规划问题的基本方法。 p1
9j
(2)无后向性 uj_ OWre
将各阶段按照一定的次序排列好之后,对于某个给定的阶段状态,它以前各阶段的状态无法直接影响它未来的决策,而只能通过当前的这个状态。换句话说,每个状态都是过去历史的一个完整总结。这就是无后向性,又称为无后效性。 LP8Stj JP
(3)子问题的重叠性 t UJ m}+=>
动态规划算法的关键在于解决冗余,这是动态规划算法的根本目的。动态规划实质上是一种以空间换时间的技术,它在实现的过程中,不得不存储产生过程中的各种状态,所以它的空间复杂度要大于其它的算法。选择动态规划算法是因为动态规划算法在空间上可以承受,而搜索算法在时间上却无法承受,所以我们舍空间而取时间。 ][|)qQ%V
所以,能够用动态规划解决的问题还有一个显著特征:子问题的重叠性。这个性质并不是动态规划适用的必要条件,但是如果该性质无法满足,动态规划算法同其他算法相比就不具备优势。 {jX
h/`
2、动态规划的基本思想 cvR|qHNX
前文主要介绍了动态规划的一些理论依据,我们将前文所说的具有明显的阶段划分和状态转移方程的动态规划称为标准动态规划,这种标准动态规划是在研究多阶段决策问题时推导出来的,具有严格的数学形式,适合用于理论上的分析。在实际应用中,许多问题的阶段划分并不明显,这时如果刻意地划分阶段法反而麻烦。一般来说,只要该问题可以划分成规模更小的子问题,并且原问题的最优解中包含了子问题的最优解(即满足最优子化原理),则可以考虑用动态规划解决。 8$:4~:]/
动态规划的实质是分治思想和解决冗余,因此,动态规划是一种将问题实例分解为更小的、相似的子问题,并存储子问题的解而避免计算重复的子问题,以解决最优化问题的算法策略。 P~V0<$C
由此可知,动态规划法与分治法和贪心法类似,它们都是将问题实例归纳为更小的、相似的子问题,并通过求解子问题产生一个全局最优解。其中贪心法的当前选择可能要依赖已经作出的所有选择,但不依赖于有待于做出的选择和子问题。因此贪心法自顶向下,一步一步地作出贪心选择;而分治法中的各个子问题是独立的(即不包含公共的子子问题),因此一旦递归地求出各子问题的解后,便可自下而上地将子问题的解合并成问题的解。但不足的是,如果当前选择可能要依赖子问题的解时,则难以通过局部的贪心策略达到全局最优解;如果各子问题是不独立的,则分治法要做许多不必要的工作,重复地解公共的子问题。 ]>NP?S
)R
解决上述问题的办法是利用动态规划。该方法主要应用于最优化问题,这类问题会有多种可能的解,每个解都有一个值,而动态规划找出其中最优(最大或最小)值的解。若存在若干个取最优值的解的话,它只取其中的一个。在求解过程中,该方法也是通过求解局部子问题的解达到全局最优解,但与分治法和贪心法不同的是,动态规划允许这些子问题不独立,(亦即各子问题可包含公共的子子问题)也允许其通过自身子问题的解作出选择,该方法对每一个子问题只解一次,并将结果保存起来,避免每次碰到时都要重复计算。 -'FzH?q:
因此,动态规划法所针对的问题有一个显著的特征,即它所对应的子问题树中的子问题呈现大量的重复。动态规划法的关键就在于,对于重复出现的子问题,只在第一次遇到时加以求解,并把答案保存起来,让以后再遇到时直接引用,不必重新求解。 .u3!%{/v(c
3、动态规划算法的基本步骤 wz-9+VN6
设计一个标准的动态规划算法,通常可按以下几个步骤进行: 0f).F
(1)划分阶段:按照问题的时间或空间特征,把问题分为若干个阶段。注意这若干个阶段一定要是有序的或者是可排序的(即无后向性),否则问题就无法用动态规划求解。 $= '_$wG
8
(2)选择状态:将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。当然,状态的选择要满足无后效性。 KJ]:0'T
(3)确定决策并写出状态转移方程:之所以把这两步放在一起,是因为决策和状态转移有着天然的联系,状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。所以,如果我们确定了决策,状态转移方程也就写出来了。但事实上,我们常常是反过来做,根据相邻两段的各状态之间的关系来确定决策。 \Gh]$sp
(4)写出规划方程(包括边界条件):动态规划的基本方程是规划方程的通用形式化表达式。 N@$g"w
一般说来,只要阶段、状态、决策和状态转移确定了,这一步还是比较简单的。动态规划的主要难点在于理论上的设计,一旦设计完成,实现部分就会非常简单。根据动态规划的基本方程可以直接递归计算最优值,但是一般将其改为递推计算,实现的大体上的框架如下:
o*2TH2
标准动态规划的基本框架 sjpcz4|K
1. 对fn+1(xn+1)初始化; {边界条件} bE-{
U/;
for k:=n downto 1 do `B+P$K<