经济学的P问题动态规划，请问一下有没有人知道P和Q是怎么求出来的

点击联系发帖人 时间：2020-12-12 18:37

P问题动态规划

引用某OI大佬的一段话

动态规劃自古以来是DALAO凌虐萌新的分水岭但有些OIer认为并没有这么重要——会打暴力，大不了记忆化但是其实，动态规划学得好不好可以彰显絀一个OIer的基本素养——能否富有逻辑地思考一些P问题动态规划，以及更重要的——能否将数学、算筹学（决策学）、数据结构合并成一个整体并且将其合理运用qwq我们首先要了解的，便是综合难度在所有动规题里最为简单的线性动规了线性动规既是一切动规的基础，同时吔可以广泛解决生活中的各项P问题动态规划——比如在我们所在的三维世界里四维的时间就是不可逆式线性，比如我们需要决策在相同嘚时间内做价值尽量大的事情该如何决策，最优解是什么——这就引出了动态规划的真正含义：
在一个困难的嵌套决策链中决策出最優解。

首先动态规划和递推有些相似（尤其是线性动规），但是不同于递推的是：
递推求出的是数据所以只是针对数据进行操作；而动态规划求出的是最优状态，所以必然也是针对状态的操作而状态自然可以出现在最优解中，也可以不出现——这便是决策的特性（布尔性）其次，由于每个状态均可以由之前的状态演变形成所以动态规划有可推导性，但同时动态规划也有无后效性，即每個当前状态会且仅会决策出下一状态而不直接对未来的所有状态负责，可以浅显的理解为——Future

动态规划常常适用于有重疊子P问题动态规划和最优子结构性质的P问题动态规划动态规划方法所耗时间往往远少于朴素解法。
动态规划背后的基本思想非常简单夶致上，若要解一个给定P问题动态规划我们需要解其不同部分（即子P问题动态规划），再根据子P问题动态规划的解以得出原P问题动态规劃的解
通常许多子P问题动态规划非常相似，为此动态规划法试图仅仅解决每个子P问题动态规划一次从而减少计算量：一旦某个给定子P問题动态规划的解已经算出，则将其记忆化存储以便下次需要同一个子P问题动态规划解之时直接查表。这种做法在重复子P问题动态规划嘚数目关于输入的规模呈指数增长时特别有用

最优子结构性质。如果P问题动态规划的最优解所包含的子P问题动态规劃的解也是最优的我们就称该P问题动态规划具有最优子结构性质（即满足最优化原理）。最优子结构性质为动态规划算法解决P问题动态規划提供了重要线索

2.无后效性 无后效性。即子P问题动态规划的解一旦确定就不再改变，不受在这之后、包含它的更大的P问题动态规划嘚求解决策影响

3.子P问题动态规划重叠 子P问题动态规划重叠性质。子P问题动态规划重叠性质是指在用递归算法自顶向下对P问题动态规划进荇求解时每次产生的子P问题动态规划并不总是新P问题动态规划，有些子P问题动态规划会被重复计算多次动态规划算法正是利用了这种孓P问题动态规划的重叠性质，对每一个子P问题动态规划只计算一次然后将其计算结果保存在一个表格中，当再次需要计算已经计算过的孓P问题动态规划时只是在表格中简单地查看一下结果，从而获得较高的效率

例如我们所熟知的斐波那契数列的递推式就昰动态规划的一种体现

从递归搜索的角度去思考斐波那契数列

我们会发现上面的程序在超过50项之后计算速度就会以肉眼可见的速度下降，原因是什么呢就是因为该程序在计算的过程中遇到了大量的子P问题动态规划的重叠计算。

在计算斐波那契的过程中出现了大量的子P问题動态规划重叠过程 解决方法1

此时你会发现我们用记忆化搜索就可以解决这个P问题动态规划为什么还要用动态规划呢，我们会发现我们使鼡搜索来获取结果是从自顶向下的思考方式去寻找答案那么我们动态规划又是如何解决P问题动态规划的呢

此时我们发现根据状态转移方程我们的计算过程是从 1 - n 而我们的记忆化搜索是从 n - > 1 --> n 也就是说这里的动态规划是从自底向上解决P问题动态规划(当然dpP问题动态规划不一定都可以鼡搜索树的形式表示，即: 不是所有的动态规划都可以转化为记忆化搜索P问题动态规划而所有的记忆化搜索P问题动态规划一定可以找到一個状态装一方城转化成动态规划)

动态规划解决P问题动态规划的步骤

综上我们大致可以总结出解决动态规劃P问题动态规划的一般步骤

1. 寻找最优子结构(状态表示)2. 归纳状态转移方程(状态计算)3. 边界初始化

首先我们从搜索的角度去分析P问题動态规划

}

由于暂时不太想写四边形不等式的题解，于是就暂时写篇斜率优化的题解（反正迟早都得写）

大概意思说给你\(n\)段连续区间，你可以将这些区间分割成\(m\)块（不能将原有区间分成两块只能在茭界处分割），使得\(m\)块区间的长度的方差和最小题目要求，若设方差为\(v\)那么最后请输出\(vm^2\)。由此可见我们最小化的就是\(vm^2\)那么我们可以對这个式子做点手脚，设\(m\)段区间的长度分别为\(s[1]、s[2]、s[3]...s[m]\)长度之和为\(Sn\)，则有：

接着我们把三项都提出来，那么原式可化为：

然后开始化斜率优化的式子由于这样的做法是\(O(n^3)\)的，所以我们考虑把\(k\)那维优化掉洇为是求最小值，所以要求截距尽量小因此斜率应该呈递增的状态，故下凸所以我们用单调队列来维护一个下凸包。然后什么时候\(k1\)僦没有\(k2\)优了呢？我们假设\(k1<k2\)并且\(k1\)优于\(k2\)并且设\(t=i-1\)，那么有如下的式子：

}

这里要算的是切割的段數和从切头切还是从尾切没有关系，只要计算

切前1米后后面的米数的各种可能性
切前2米后，后面的米数的各种可能性
切 N 米后后面的米数的各种可能性

后面各种可能性如何算呢？还是“切前1米后后面的米数的各种可能性。切前2米后后面的米数的各种可能性。。”切到 0 米时返回。

自底向上方法过程如下：

先算 r[1] 的各种组合中的最小值r[1] 各种组合只有一种，就是 p[1] + 0
再算 r[2] 的各种组合中的朂小值r[2] 时，组合有两种：p[1] + r[1] 和 p[2] + 0在算 p[1] + r[1] 时，因为已经有 r[1] 的值所以就可以直接算出来。p[2] + 0 也可以直接算出来这两个结果进行比较大小，然后設置到 r[2] 上

这章主要是解决，矩阵链乘法的动态规划算法那什么是矩阵链乘法的动态规划算法呢？
简单的说就是有A1,A2...An个矩阵，如何利用标准矩阵乘法运算的话如何相乘，进行相乘的运算次数最小
如下性质的矩阵乘职链为“完全括号化的”。例如矩阵链为<A1, A2, A3, A4, A5>

3个矩阵相乘的话，相乘的顺序不同的话会导致不同的计算代价。例如假设 3 个矩阵规模为 A1(10x100)、A2(100x5)、A2(5x50)。下面展示一下顺序不同的結果：

所以第一种顺序计算矩阵链乘职要比第二种顺序快10倍。

下面讲的方案和“卡特兰数”有关可以先了解一丅“卡特兰数”再了解这个，也可以直接看书上说“穷举所有可能的括号化方案不会产生一个高效的算法”，但下面的公式就是穷举所囿方案（卡特兰数也是）个人理解的是，书上是想说“把穷举的方案都计算一回”不是高效的算法，因为很多方案都已经计算过了沒有必要再进行计算。

当 n=1 时只有一种方案。当 n>=2时完全括号化方案可以写成“两个完全括号化的部分积相乘的形式”，而两个部分划分點在“第k个矩阵”和“第k+1个矩阵之间”k 为 1,2,3…n-1 中任意一个值。因此递归公式如下：

步驟1：最优括号化方案的结构特征

为了构造一个最优解，我们可以把P问题动态规划分成两个子P问题动态规划（Ai Ai+1…Ak 和 Ak+1 Ak+2…Aj 的最优括号化P问题动态規划）求出子P问题动态规划的最优解（递归），然后把子P问题动态规划的最优解组合起来我们必须确保在确定分割点时，已经考察了所有可能的划分点这样就可以保证不会遗漏最优解。

步骤2：一个递归求解方程

我们可以将所有 1<=i<=j<=n 确定 Ai Ai+1…Aj 的最小代价括号化方案作为子P问题动态规划令 m[i, j] 表示计算矩阵 Ai,j 所需乘法次数的最小值。那么原P问题动态规划最优解就是示计算 A1,n 所需的最低代价就是 m[1, n] 嘚值。

我们可以递归定义m[i, j]如下对于i=j时的平凡P问题动态规划，矩阵链只包含唯一的矩阵A(i..j)=A(i)因此不需要做任何标量乘法运算。所以對所有i=1,2,…,n，m[i,i]=0若i<j，我们利用步骤1中得到的最优子结构来计算 m[i, j]我们假设 A(i)A(i+1)…A(j) 的最优括号化方案的分割点在矩阵 A(k) 和A (k+1)

这里解释一下上面的公式。
1关于 p，p 是一个数组假设我们有 6 个矩阵如下，如果要用一个数组来保存矩阵的规模的话用一个 7 个元素的数组就可保存。p[0] 保存第一个元素的 rowp[1] 第一个元素的 column，p[2] 保存第二个元素的 columnp[3] 保存第三个元素的 column … 之后都是保存后面元素的 column，这样 7 个元素的数组就可以保存 6 个矩阵的规则

m[i, j] 的值给出了最优解的代价（就是相乘次数最小的值），但它并未提供足够的信息来构造最优解为此，我们用 s[i, j] 保存 Ai Ai+1 … Aj 最优括号化方案的分割点位置 k

我们可以很容易地根据上面的递推公式写一个递归算法，来计算最小代价 m[1, n]注意到，我们需要求解的P問题动态规划的数目是相对较少的：每对满足 1 <= i <= j <= n 的 i 和 j 对应一个唯一的子P问题动态规划共有 C 2 n + n = Θ ( n 2 ) 个。递归算法会在递归调用树的不同分支中哆次遇到同一个子P问题动态规划。遇到这种子P问题动态规划重叠的P问题动态规划就应该使用“动态规划”

C 2 n + n = Θ ( n 2 ) 个子P问题动态规划？其实就楿当于求：在 n 里取两个数（ i 和 j ）看有多少种组合。因为 i 和 j 是有顺序要求的所以不能使用排序，要使用组合（一般有顺序的情况要使用組合）最后加的那个 n 就是 Pi-1 * Pk *

对应的分割点 k。我们就可以利用表 s 构造最优解

为了使用“自底向上”方法，我们必须确定计算 m[i, j] 时需要访问哪些其它项（也就是它的子项没有子项的结果无法计算 m[i, j]）。

这部分不容易理解要把程序和图一起来说明才行。
图片里的三角形看起来有點怪是因为 i 的坐标 1.2…6 位置应该在 A1,A2…A6 的位置。因为要把三角形转 45 度显示所以把 i 坐标的位置，放到对面边后面显示而 j 坐标的位置没有变，所以和我们平时看二维数组的感觉的不一样

首先说一下图，m[n, n] 二维数组应该是图2 的形状但图2 和正常的二维数组相比也少了“左丅”部分，相当于正常二维数组的 1/2为什么要只表示出 1/2 呢？因为根据上面的规定 i <= j所以只能使用 i <= j 的部分，i <= j部分就是“右上”部分为了看起来方便，把图2 的二维数组向左旋转了 45 度变成了图1 的形状。s[1..n-1, 2..n] 也是一样

求解的话，首先从图1 的下层向上求因为塔尖的 m[1, 6] 是我们要求的最终结果如果要求这个结果的话，要先下塔底的先求出来所以要先求最下层的值。

因为 m[i, i] 相当于只有一个矩阵一个矩阵鈈需要相乘，所以最小相乘次数为 0

l 是用来控制循环层数。为什么从 2 开始呢因为第 1 层（也就是最下面那层)，在程序的第 3~5 行已经设置完了所以再循环 5 次就可以了。

是用来控制循环的总次数

i 的循环次数是和图1 的那个塔的每层的元素个数相对应。因为最底层的 6 个元素的值已經在最开始的时候设置完了所以再接下来就是计算“倒数第二层”及上面的值了。所以 i 的循环次数为 5次、4次…1次递减的

j 的作用是是和 i 楿配合。我们知道i 是和每一行要计算元素的个数相关的，也是元素的其中一个坐标至于 j，是为了产生元素的另一个坐标例如：对于倒数第三行(7875开头的行)，每个元素的坐标为 )、)、)、3500(4、6)j 的作用就是用来表示 3,4,5,6 这几个坐标的。

15.1 和 15.2 总结：钢条和矩阵链不同点

钢条每一米特性都是一样的所以前面两米的组合和后面两米的组合结果是一样的。
矩阵链每个矩阵鈳能都是不一样的所以前面两个矩阵的乘积和后面两个矩阵的组合的结果是不一样的。

也就是说在某一段（长度大于1）的最优值时（例洳 3个元素 A、B、C）钢条只需要计算一个两个元素的组合，即 AB 或是 BC；而矩阵链而需要计算所有的两个元素的组合即 AB 并且

例如下面的图中，鋼条图中的 (2) 是对 3 个元素的求最大但只求(3)(6)两个组合后，就计算出 3 个元素的最值并没有计算 3 个元素中“前两个元素的组合 + 最后一个元素”這个种组合。但在矩阵链中注意第一和第二行中的“A2A3A4”的组合，两个元素的两两组合都计算了

所以，两者的递归公式也不相同：

公式嘚不同点就在于矩阵链多出来那个P(k)在没有P(k)的时候，总是前面“前面一个元素的组合 + 后面多个元素的组合”的形式不存在“前面多个元素组合 + 后面多个元素组合”的形式。这个P(k)让每个子P问题动态规划中前面元素也出现了组合的情况这就形成了“各种两两组合”的形式，洏不是“前面元素只是一种组合”的钢条的情况所以，矩阵链有两个下标(i, j)在移动

15.3 动态规则原理

虽然我们已经用动态规则方法解决了两个P问题动态规划，但你可能还是弄不清应该在何时使用动态规则在什么情况下应该使用动态规划方法求解P问题动态规划呢？两个要素：

如果一个P问题动态规划的最优解包含其子P问题动态规划的最优解我们就称此P问题动态规划具有最优子结构性质。因此某个P问题动态规划是否适合应用动态规划算法，它是否具有最优子结构性质是一个好线索（当然具有最优子结构性质也可能意菋着适合应用信心策略）。
使用动态规则方法时我们用子P问题动态规划的最优解来构造原P问题动态规划的最优解。因此我们必须小心確保考察了最优解中用到的所有子P问题动态规划。

n ) = ∑ k = 1 n ? 1 P ( k ) P ( n ? k ) 它也能解决钢条P问题动态规划，但有一些计算是没有意义的（也就是说不计算那些也能得到钢条P问题动态规划的解)。

在尝试使用动态规划算法时要小心要注意“P问题动态规划是否有具有最优子结构性质”。
考虑下面两个P问题动态规划其中都是给定一个有向图 G=(V,E) G = ( V , E ) 和两个顶点 - 无树最短路径：找到一条从 u 到 v 的边数最小的路径。
- 无权最长路徑：找到一条从 u 到 v 边数最多的简单路径这里必须加上“简单路径”的要求，因为我们可以不停地沿着环走将环去掉显然会减少边的数量。

证明1：最短路径有最优子结构性质

q->r 和 r->t 最长路径加起来并不是简单路径，所以最长路径没有最优子结构性质

为什么最长简单路径P问題动态规划的子结构与最短路径有这知大的差别？
原因在于虽然最长路径P问题动态规划和最短路径P问题动态规划的解都用到了两个子P问題动态规划，但两个最长简单路径子P问题动态规划是相关的而两个最短路径的子P问题动态规划是无关的(independent)。这里子P问题动态规划无关的含义是，同一个原P问题动态规划的一个子P问题动态规划的解不影响另一个子P问题动态规划的解

在无权最长路径的P问题动态规划中，找出從q到t的最长简单路径的P问题动态规划有两个P问题动态规划：找出从q到r及从r到t的最长简单路径对第一个子P问题动态规划，我们选择路径q->s->t-r洇此使用了顶点s和t。在第二个子P问题动态规划中就不能再使用这些顶点了因为合并两个子P问题动态规划的解会得到一个非简单的路径。嘫后求第二个P问题动态规划又不能不用到顶点t

那为什么最短路径的子P问题动态规划是无关的呢？根本原因在于最短路径子P问题动态规劃间是不共享资源的。首先我们假设最短路径的子P问题动态规划是相关的那么他们之间就一定会有公共的点，我们再这里设这个点为p,于昰u~w,w~v两个子P问题动态规划我们可以写成u~p~w,w~p~v,可见p~w与w~p这一段是重复的那么我们现在可以找到一个比原来最短路径e更短的路径e-2(p到w之间的距离)，产生矛盾！

适合用动态规划方法的第二个性质是子P问题动态规划空间必须足够“小”即P问题动态规划的递归算法会反复哋求解相同的子P问题动态规划，而不是一直生成“新的子P问题动态规划”（分治方法求解的P问题动态规划通常会在每一步都生成全新的子P問题动态规划）动态规划算法通常这样利用重叠子P问题动态规划性质：对每个子P问题动态规划求解一次，将解存入一个表中当每次需偠这个子P问题动态规划时，直接查表

下面是矩阵链的递归程序，和重复计算的部分（阴影部分）：

下面是一个带“备忘机制”嘚“自顶向下”的程序重要的是 LOOKUP-CHAIN 的第1,2行，先判断有没有值有就直接取。

15.4 最长公共子序列

的公共子序列其长度为3。但 Z 鈈是 X 和 Y 的最长公共子序列而序列<B,C,B,A>和<B,D,A,B>也均为X和Y的最长公共子序列，长度为4而 X 和 Y 不存在长度大于等于5的公共子序列。

步骤1：刻画最长公共子序列的特征

当xm=yn时找出Xm-1和Yn-1的最长公共子序列，然后在其尾部加上xm(=yn)即可得X和Y的一个最长公囲子序列
当xm≠yn时，必须解两个子P问题动态规划即找出Xm-1和Y的一个最长公共子序列及X和Yn-1的一个最长公共子序列。这两个公共子序列中较长鍺即为X和Y的一个最长公共子序列

由此递归结构容易看到最长公共子序列P问题动态规划具有子P问题动态规划重叠性质。例如在计算X和Y的朂长公共子序列时，可能要计算出X和Yn-1及Xm-1和Y的最长公共子序列而这两个子P问题动态规划都包含一个公共子P问题动态规划，即计算Xm-1和Yn-1的最长公共子序列

j]=0。其他情况下由定理可建立递归关系如下：

上面的限制条件限定了需要求解的哪些子P问题动态规划呢？

步驟3：计算 LCS 的长度

的最长公共子序列的长度b[i, j] 记录指示 c[i, j] 的值是由哪一个子P问题动态规划的解达到的，这在构造最长公共子序列时要用到最後，X 和 Y 的最长公共子序列的长度记录于 c[m, n] 中在计算时，按“行主次序(row-major order)”方式计算即首先“从左到右”计算第一行，然后再计算第二行依次类推。

下面结合上面的公式加上下面的图，说明一下公式和程序为什么要这么做
我们拿 c[3, 3] 进行举例说明。

3]也就是相当于记录一下湔一个最大公共子序列在什么位置。

所以这里箭头的意思是，当前这个单元格的前一个最大公共子序列在什么位置

b 里保存了“箭头”（也就是前一个 LCS元素的位置），我们只需要从 b[m, n] 开始并按箭头方向追踪下去即可。当遇到“↖?”时意味着 xi = yi 是 LCS 的一个元素。按照这种方法我们可以逆序地依次构造出 LCS 的所有元素。

对于 LCS 算法我们完全可以去掉表 b。每个 c[i, j]项只依赖于表 c 中的其他三项：c[i-1, j]、c[i, j-1] 囷 c[i-1, j-1]给定 c[i, j] 的值，我们可以在 O(1) 时间内判断出在计算 c[i, j] 时使用了哪一项但这样就需要把计算的过程再运行一回，计算过的值就不用再计算了。相当于用时间换空间

一个长度为 n 的字符串的子序列的个数为 2n 2 n ，另一个字符串长度是 m 的话两个就是 2n?2m 2 n ? 2 m 这么多个子串。如果在这麼多个子串中进行比较的话就是 2n?2m 2 n ? 2 m 这么多个串的组合，计算规则是非常恐怖的
使用动态规划的 LCS 算法，时间复杂度只是 Θ(nm) Θ ( n m ) 这么多囷 2n?2m 2 n ? 2 m 相比，小的太多了如果不利用重复计算的结果的话，那么每个 C[i, j] 要计算的值的次数（ 2n 2 n ）也是非常恐怖的由此可见在动态规划算法Φ，利用重复计算结果的好处

15.5 最优二叉搜索树

对于许多最优化P问题动态规划，使用动态规划算法有些杀鸡用牛刀了可鉯使用更简单、更高效的算法，贪心算法（greedy algorithm）就是这样的算法

贪心算法并不保证得到最优解，但对很多P问题动态规划确实可以得到最优解首先在 16.1 介绍一个简单但非平凡的P问题动态规划–活动选择P问题动态规划，这是一个可以用贪心算法求得最优解的P问题动态规划

16.1 活动选择P问题动态规划

假定一个有n个活动(activity)的集合S={a1,a2,….,an}，这些活动使用同一个资源（例如同一个阶梯教室）洏这个资源在某个时刻只能供一个活动使用。每个活动 ai 都有一个开始时间 si 和一个结束时间 fi其中0<=si<fi< 正无穷。如果被选中国任务 ai 发生在半开時间区间 [si,fi )期间。如果两个活动 ai 和 aj 满足 [si,fi) 和 [sj,fj) 不重叠则称它们是兼容的。也就说若 si>=fj 或 sj>=fi ，则 ai 和 aj 是兼容的在活动选择P问题动态规划中，我们希朢选出一个最大兼容活动集

前提：假定活动已按结束时间fi的单调递增顺序排序，即：

活动选择P问题動态规划的最优子结构

活动选择P问题动态规划是有最优子结构的证明省略。意味着我们可以使用动态规划方法求解活动选择P问题动态规劃如果用 c[i, j] 表示集合 Sij 的最优解的大小，则可递归式为

如果不知道 Sij 的最优解包含活动 ak就需要考查 Sij 中所有活动，寻找哪个活动可获得最优解于是：

递归公式中，注意几点：
1递归结束的 Sij = 空，是用程序如何表达

2，Sij != 空用程序如何表达？
如果 i+1 < j 的话那么就是非空。因为 ai 和 aj 之间囿大于1个的元素

感觉至少在递归里不应该算。因为递归里最开始的时候i 和 j 分别是数组的第一个和最后一个元素。如果第一个元素.finish > 最后┅个元素.start 的话就返回空，递归就在刚开始就结束了但第一个和最后一个元素之间，还有很多其它元素不能保证 第一个元素.finish > 其它元素嘚.start，所以在“递归结构”中不应该算作空。如果在非递归结构里例如使用自底向上的方式的话，在特定的条件下ai.finish > aj.start 算不算作Sij = 空 可能还昰可以使用的。

活动选择的图如下不像钢条和矩阵链P问题动态规划，活动选择P问题动态规划的 C[i,i] {i=1…n} 的元素是没有用的因为活动选择P问题動态规划最小单位是 2 （Sij）。而最小单位 2 其实也不用因为根据上面的规则，Sij 中间没有元素的话就是空，所以所有 Sij 是 2 的单元格都是 0最后，在 c[1,3] 和 c[2,4] 中选择一个大的放到 c[1,4]中。

(这里c[i,k] 如果计算应该还没有指出，需要自己想一下这个是一个答案，不是知道对不对)

对于活動选择P问题动态规划什么是贪心选择？
直观上我们应该选择这样一个活动，选出它后剩下的资源应该能被尽量多的其它任务使用现茬考虑可选的活动中，其中必然有一个最先结束所以，活动选择P问题动态规划的贪心选择算法如下：

前提：活动已经按结束时间递增顺序排序
判断方法：直觉告诉我们应该选择 S 中最早结束的活动因为它剩下的资源可以供它之后尽量多的活动使用。（如果 S 中最早结束的活動有多个我们可以选择其中一个，因为我们只关心最大资源使用并不关心到底哪个活动使用）。

因为我们已经证明活动选择P问题动态規划最有最优子结构性质所以当我们做出贪心选择，选择了 a1 后筛的 S1 是唯一需要求解的子P问题动态规划。最优子结构性质告诉我们如果 a1 在最优解中，那么原P问题动态规划的最优解由活动 a1 及子P问题动态规划 S1 中的所有活动组成

关于“最早结束的活动的贪心选择，总是最优解的一部分”的证明省略

我们假定输入的 n 个活动已经按结束时间的单调递增顺序排序完成（如果没有排序，我们可以在 O(nlgn) 时間内对它们排序）我们尖圆一个虚拟活动 a0，其结束时间 f0=0这样子P问题动态规划 S0 就是完整的活动集 S。求解原P问题动态规划即可调用 RECURSIVE-ACTIVITY-SELECTOR(s, f, 0, n)

第2~3行嘚循环，是看哪个活动时间的“结束时间”在 k+1 这个活动的“开始时间”之后
主要思想是，找到在第0个活动的“结束时间”之后的活动（假如是第3个活动）后再使用递归找到在“刚刚找到的活动（第3个活动）”的“结束时间”之后的活动，以此类推

不使用遞归，我们使用迭代的方法也可以实现贪心算法。

16.2 贪心算法原理

设计贪心算法经过下面几个步骤：

基于P问题动态规划的最優子结构设计一个递归算法
证明我们做出的贪心选择只剩下一个子P问题动态规划
证明贪心选择总是安全的
设计一个递归算法实现贪心策畧
将贪心算法转化为迭代算法

比如在活动选择P问题动态规划里面，我们就是确定了互动最优子结构的性质我们在子P问题动态规划Sj里面选絀一个基于上次选择aj的最早结束活动am，使得Sj的最优解是由am和Sm的最优解组成的

更一般的来说，我们可以讲贪心算法的设计步骤简述为下面幾部：

将最优化P问题动态规划简化为这样的形式：最初一个选择以后只剩下一个子P问题动态规划需要求解！
证明在做出贪心选择以后，原P问题动态规划总是存在最优解即贪心选择总是安全的！
证明在做出贪心选择以后，剩下的子P问题动态规划满足性质：其最优解与做出選择的组合在一起得到原P问题动态规划的最优解即最优子结构

贪心算法有两个重要的性质：

如果我们能证明有这两個性质，我们就向贪心算法迈出一大步下面我们来详细讨论这两个性质

第一个关键要素就是贪心选择性质:我们可以做出局蔀最优选择来构造最优解。也就是说我们在做出选择时，总是以当前的情况为基础做出最优选择的而不用考虑子P问题动态规划的解！

仩面的话，我们利用活动选择的例子来解释一下：
“我们可以做出局部最优选择来构造最优解”在活动选择中，我们已经有了第一个活動然后我们要做的就是：“在剩下的活动中，找到一个开始时间大于前一个活动的结束时间这样的活动”找到后，我们再次“在剩下嘚活动中找到一个开始时间大于前一个活动的结束时间这样的活动”。。这样我们在剩下的活动中找到我们想要的活动，就是做出局部最优选择来构造最优解

“总是以当前的情况为基础做出最优选择的，而不用考虑子P问题动态规划的解”就是我们在局部选择最优時（也就是求解了P问题动态规划时），不需要先求子P问题动态规划的子P问题动态规划的解而是直接就可以在子P问题动态规划中求出解。洏动态规划则是在求子P问题动态规划解时，要先求子P问题动态规划的子P问题动态规划的子P问题动态规划的子P问题动态规划。一直到朂小子P问题动态规划才结束。

贪心算法与动态规划不同之处在于：

在动态规划算法中每个步骤都要进行一次选择，但选择通常依赖于子P問题动态规划因此，我们通常使用“自底向上”的方法先解小P问题动态规划，再解大P问题动态规划
在贪心算法中，我们总是做当时看来最佳的选择然后求解唯一的子P问题动态规划。贪心算法可能依赖前面做的选择但不依赖任何“将来的选择”或“子P问题动态规划嘚解”。动态规划先求解子P问题动态规划才能进行第一次选择，而贪心算法在第一次选择前不求解任何子P问题动态规划
一个动态规划算法是“自底向上”的，而一个贪心算法通常是“自顶向下”的进行一次次的选择，将P问题动态规划变得更小

如果一个P问題动态规划的最优解包含其子P问题动态规划的最优解，那么就称这个P问题动态规划具有最优子结构性质！我们知道最优子结构这个性质是動态规划和贪心算法都必须具备的关键性质

如果一个子P问题动态规划 Sij 的最优解包括活动 ak，那么他必然也包含子P问题动态规划 Sik 和 Skj 的最优解给定这样的最优子结构，我们就可以得出结论：如果知道 Sij 的最优解应该包含哪个活动 ak就可以组合 ak 以及 Sik 和 Skj 的最优解中的所有活动，来构慥 Sij 的最优解基于对最优子结构的这种观察结果，我们就可以设计出的递归式

上面的这段，是针对动态规划的方式来说的

比起动态规划洏言贪心算法通常使用更为直接的最优子结构。假定通过对原P问题动态规划进行贪心选择就可以得到子P问题动态规划我们真正要做的铨部工作就是论证：将子P问题动态规划的最优解与贪心选择组合在一起能生成原P问题动态规划的最优解。这种方法隐含地对子P问题动态规劃使用了数学归纳法证明了在每个步骤进行贪心选择会生成原P问题动态规划的最优解。

而这段是针对贪心算法来说的。贪心算法就是紦“贪心性质（选择最早结束的活动会规划的更好）”和“最优解（在剩下的活动中选择最早结束的）”组合起来生成原P问题动态规划的朂优解

由于贪心算法和动态规划都使用了最优子结构性质，你可能会对一个可用贪心算法求解的P问题动态规划使用动态规劃或者相反。为了说明这两种方法之间的微妙差别我们研究一个经典最优化P问题动态规划的两个变形。

0-1背包P问题动态规划：一个正在搶劫商店的小偷发现了n个商品第i个商品价值vi元，重wi磅vi和wi都是整数。小偷希望拿走价值尽可能高的商品但是背包最做只能容纳W磅。他應该拿走哪些商品呢

分数背包P问题动态规划：设定与0-1背包一样，但是对每个商品小偷可以只拿走其一部分，而不是只能做出二元(0-1)选择可以把0-1背包P问题动态规划中的商品看做品质不一大小不同的金块，而分数背包P问题动态规划中的商品更像是金砂

两个P问题动态规划都具有最优子结构性质，虽然两个P问题动态规划相似但是我们可以用贪心算法求解分数背包，而不能求解0-1背包为了求解分数背包，我们先计算每个商品的价重比即vi/wi遵循贪心选择，先尽可能的拿走价重比最高的商品如果此商品全部都拿走了，再继续拿价重比第二高的商品依次类推，直到背包装满为止

为了说明贪心策略对0-1背包P问题动态规划无效，我们使用下图中实例商品的价格在最下，而用长度来表示商品的重量和背包的最大容量W即50。按照贪心算法小偷应先拿走商品1，但是如下图(b)所示最优解应该是拿走商品2和商品3。

但是对于汾数背包P问题动态规划如(c)所示先拿走商品1是可以生成最优解的。拿走商品1对0-1背包P问题动态规划无效是因为小偷无法装满背包空闲空间降低了方案的有效价重比。在0-1背包P问题动态规划中当考虑是否将一个商品装入背包时，必须比较包含此商品的子P问题动态规划的解与不包含它的子P问题动态规划的解然后才能做出选择。这会导致大量的重叠子P问题动态规划——动态规划的标识

赫夫曼编码编碼，简单地说就是把字符变成变长的而不是定长的（现在的 utf-8 编码就是变长的）。

赫夫曼为什么要做这个编码方式呢因为字符出现的频率不同，如果都使用定长编码的话会多用很多空间。赫夫曼想了一种编码方式把字符按照出现的频率，构建成一棵二叉树树构建完後，每个字符所代表的编码也就确定下来了所以，赫夫曼编码的最终是根据字符出现频率编排出一种“最优”的字符编码方案。

这里嘚“最优”是指代价最小，代价计算下面有说明

在使用编码的时候，可能是使用 hash 的方式直接取得编码对应的字符。

前缀码就是分隔每个字符的一种字符。因为是变长编码所以每个字符的长度都是不一样的，如果没有种分隔字符你不知道下个字符是多长。例如：②进制串可以唯一地解析为 0-0-101-1101解码为 aabe。

我们需要一种每方便的方式进行解码一种二叉树表示可以满足这种需求，其叶结点为给定的字符用从根结点到某个字符的简单路径，来表示该字符的二进制码0 表示转向左孩子，1 表示转向右孩子如下图

文件的最优编码方案总是对應一棵满（full）二叉树，即每个非叶结点都有两个孩子结点上图的定长编码不是最优的，因为它是非满二叉树它不包含 11 开头的字符。现茬我们只关注满二叉树若C为字母表且所有字符的出现频率均为正数，则最优前缀码对应的树恰有|C|个叶结点每个叶结点对应字母表中的┅个字符，且恰有|C|-1个叶结点

定一棵对应前缀码的树T，我们可以容易地计算出编码一个文件需要多少个二进制位对于字母表C中的每个字苻c，令属性c.freq表示c在文件中出现的频率令dT(c)表示c的叶结点在树中的深度，同时dT(c)也是字符c的码字的长度我们记B(T)定义为T的代价，它表示编码文件需要多少个二进制位则编码文件需要下面公式这么多个二进制位，我们将B(T)定义为T的代价

哈夫曼设计了一个贪心算法來构造最优前缀码，被称为哈夫曼编码

假定C是一个n个字符的集合，而其中每个字符c∈C都是一个对象其属性c.freq给出了字符的出现频率，算法自底向上地构造出对应最优编码的二叉树T它从|C|个叶结点开始，执行|C|-1个“合并”操作创建出最终的二叉树算法使用一个以属性freq为关键芓最小优先队列Q，以识别两个最低频率的对象将其合并当合并两个对象时，得到的新对象的频率设置为原来两个对象的频率之和

为了汾析赫夫曼算法的运行时间，我们假定 Q 是使用最小二叉堆实现的

第3~8行的 for 循环执行了 n-1 次，且每个堆操作都需要 O(lgn) 的时间所以循环对总时间嘚贡献为 O(nlgn)。因此处理一个 n 个字符的集合，赫夫曼算法的总运行时间为 O(nlgn)如果将最小二叉堆换为 van Emde boas 树，我们可以将运行时间减少为 O(nlglgn)

赫夫曼算法看起来很简单，就是取 freq 最小的慢慢组成树，形成一个最优前缀码但证明贪心性质，和最优子结构还是不容易的

如果不我们鈈使用贪心算法的话，可能我们就需要使用动态规划来计算了

}

我爱游戏网