算法竞赛专题解析（12）：DP优化(2)--斜率(凸壳)优化

Dabria ·

更新时间:2024-09-20

· 781 次阅读

本系列是这本算法教材的扩展资料：《算法竞赛入门到进阶》(京东当当 ) 清华大学出版社
如有建议，请联系：（1）QQ 群，567554289；（2）作者QQ，15512356

文章目录1. 把状态方程变换为平面的斜率问题2. 求一个dp[i]3. 求所有的dp[i]4. 例题5. 习题

有一类DP状态方程，例如：
dp[i]=min{dp[j]−a[i]∗d[j]}dp[i] = min\{dp[j] - a[i]*d[j]\}dp[i]=min{dp[j]−a[i]∗d[j]} 0≤j<i，d[j]≤d[j+1],a[i]≤a[i+1]0≤j<i，d[j]≤d[j+1], a[i]≤ a[i+1]0≤j<i，d[j]≤d[j+1],a[i]≤a[i+1]
它的特征是存在一个既有iii又有jjj的项a[i]∗d[j]a[i]*d[j]a[i]∗d[j]。
编程时，如果简单地对iii和jjj循环，复杂度是O(n2)O(n^2)O(n2)的。
通过斜率优化（英文convex hull trick，凸壳优化），把时间复杂度优化到O(n)O(n)O(n)。
斜率优化的核心技术是斜率（凸壳）模型和单调队列。

1. 把状态方程变换为平面的斜率问题

方程对某个固定的iii，求jjj变化时dp[i]dp[i]dp[i]的最优值，所以可以把关于iii的部分看成固定值，把关于jjj的部分看成变量。把minminmin去掉，方程转化为：
dp[j]=a[i]∗d[j]+dp[i]dp[j] = a[i]*d[j] + dp[i]dp[j]=a[i]∗d[j]+dp[i]
为方便观察，令：y=dp[j]y = dp[j]y=dp[j]，x=d[j]x = d[j]x=d[j]，k=a[i]k = a[i]k=a[i]，b=dp[i]b = dp[i]b=dp[i]，方程变为：
y=kx+by = kx + by=kx+b
斜率优化的数学模型，就是把状态转移方程转换为平面坐标系直线的形式：y=kx+by = kx + by=kx+b。其中：
（1）变量xxx、yyy和jjj有关，并且只有yyy中包含dp[j]dp[j]dp[j]。点(x,y)(x, y)(x,y)是题目中可能的决策。
（2）斜率kkk、截距bbb与iii有关，并且只有bbb中包含dp[i]dp[i]dp[i]。最小的bbb包含最小的dp[i]dp[i]dp[i]，也就是状态方程的解。
注意应用斜率优化的2个条件：xxx和kkk是单调增加的，即xxx随着jjj递增而递增，kkk随着iii递增而递增。

2. 求一个dp[i]

先考虑固定iii的情况下求dp[i]dp[i]dp[i]。由于iii是定值，那么斜率k=a[i]k = a[i]k=a[i]可以看成常数。当jjj在0≤j<i0≤j<i0≤j<i内变化时，对某个jrj_rjr，产生一个点vr=(xr,yr)v_r=(x_r, y_r)vr=(xr,yr)，这个点在一条直线y=kx+bry = kx + b_ry=kx+br上，brb_rbr是截距。如图1。

图1 经过点(x, y)的直线

对于0≤j<i0≤j<i0≤j<i中所有的jjj，把它们对应的点都画在平面上，这些点对应的直线的斜率k=a[i]k= a[i]k=a[i]都相同，只有截距bbb不同。在所有这些点中，有一个点v′v'v′所在的直线有最小截距b′b'b′，算出b′b'b′，由于b′b'b′中包含dp[i]dp[i]dp[i]，那么就算出了最优的dp[i]dp[i]dp[i]。如图2。

图2 经过最优点v'的直线

如何找最优点v′v'v′？利用“下凸壳”。
前面提到，xxx是单调增加的，即xxx随着jjj递增而递增。图3(1)中给出了了4个点，它们的xxx坐标是递增的。

(1)原图（2）去掉点3 （3找到最优的v'点图3 用下凸壳找最优点

图3(1)中的1、2、3构成了“下凸壳”，“下凸壳”的特征是线段12的斜率小于线段23的斜率。2、3、4构成了“上凸壳”。经过上凸壳中间点3的直线，其截距b肯定小于经过2或4的有相同斜率的直线的截距，所以点3肯定不是最优点，去掉它。
去掉“上凸壳”后，得到图3(2)，留下的点都满足“下凸壳”关系。最优点就在“下凸壳”上。例如在图3(3)中，用斜率为kkk的直线来切这些点，设线段12的斜率小于kkk，24的斜率大于kkk，那么点2就是“下凸壳”的最优点。
以上操作用单调队列编程很方便。
（1）进队操作，在队列内维护一个“下凸壳”，即每2个连续点组成的直线，其斜率是单调上升的。新的点进队列时，确保它能与队列中的点一起仍然能够组成“下凸壳”。例如队列尾部的2个点是v1v_1v1、v2v_2v2，准备加入队列的新的点是v3v_3v3。比较v1v_1v1、v2v_2v2、v3v_3v3，看线段v1v2v_1v_2v1v2和v2v3v_2v_3v2v3的斜率是否递增，如果是，那么v1v_1v1、v2v_2v2、v3v_3v3形成了“下凸壳”；如果斜率不递增，说明v2v_2v2不对，从队尾弹走它；然后继续比较队列尾部的2个点和v3v_3v3；重复以上操作，直到v3v_3v3能进队为止。经过以上操作，队列内的点组成了一个大的“下凸壳”，每2个点组成的直线，斜率递增，队列保持为单调队列。
（2）出队列，找到最优点。设队头的2个点是v1v_1v1、v2v_2v2，如果线段v1v2v_1v_2v1v2的斜率比kkk小，说明v1v_1v1不是最优点，弹走它，继续比较队头新的2个点，一直到斜率大于kkk为止，此时队头的点就是最优点v′v'v′。

3. 求所有的dp[i]

以上求得了一个dp[i]dp[i]dp[i]，复杂度O(n)O(n)O(n)。如果对所有的iii，每一个都这样求dp[i]dp[i]dp[i]，总复杂度仍然是O(n2)O(n^2)O(n2)的，并没有改变计算的复杂度。有优化的方法吗？
一个较小的i1i_1i1，它对应的点是{v0,v1,...,vi1v_0, v_1, ..., v_{i1}v0,v1,...,vi1}；一个较大的i2i_2i2，对应了更多的点{v0,v1,...,vi1,...,vi2v_0, v_1, ..., v_{i1}, ..., v_{i2}v0,v1,...,vi1,...,vi2}，其中包含了i1i_1i1的所有点。当寻找i1i_1i1的最优点时，需要检查{v0,v1,...,vi1v_0, v_1, ..., v_{i1}v0,v1,...,vi1}；寻找i2的最优点时，需要检查{v0,v1,...,vi1,...,vi2v_0, v_1, ..., v_{i1}, ..., v_{i2}v0,v1,...,vi1,...,vi2}。这里做了重复的检查，并且这些重复是可以避免的。这就是能优化的地方，仍然用“下凸壳”进行优化。
（1）每一个iii所对应的斜率ki=a[i]k_i = a[i]ki=a[i]是不同的，根据约束条件a[i]≤a[i+1]a[i]≤ a[i+1]a[i]≤a[i+1]，当iii增大时，斜率递增。

图4 多个i对应的直线

（2）前面已经提到，对一个i1i_1i1找它的最优点的时候，可以去掉一些点，即那些斜率比ki1k_{i1}ki1小的点。这些被去掉的点，在后面更大的i2i_2i2时，由于斜率ki2k_{i2}ki2也更大，肯定也要被去掉。
根据（1）和（2）的讨论，优化方法是：对所有的iii，统一用一个单调队列处理所有的点；被较小的i1i_1i1去掉的点，被单调队列弹走，后面更大的i2i_2i2不再处理它们。
因为每个点只进入一次单调队列，总复杂度O(n)O(n)O(n)。
下面的代码演示了以上操作。

//q[]是单调队列，head指向队首，tail指向队尾，slope()计算2个点组成的直线的斜率
for(int i=1;i<=n;i++){ 
    while(head<tail && slope(q[head],q[head+1])<k)  //队头的2个点斜率小于k 
        head++;                                     //不合格，从队头弹出
    int j = q[head];   //队头是最优点
    dp[i] = ...;       //计算dp[i]
    while(head<tail && slope(i,q[tail-1])<slope(q[tail-1],q[tail]))   //进队操作
        tail--;        //弹走队尾不合格的点
    q[++tail] = i;     //新的点进队列
}

为加深对上述代码的理解，考虑一个特例：进入队列的点都符合“下凸壳”特征，且这些点组成的直线的斜率大于所有的斜率kik_iki，那么结果是：队头不会被弹出，进队的点也不会被弹出，队头被重复使用nnn次。

图5 一个特例 4. 例题

下面用一个例题给出典型代码。

HDU 3507 Print Article http://acm.hdu.edu.cn/showproblem.php?pid=3507
题目描述：打印一篇包含N个单词的文章，第i个单词的打印成本为Ci。在一行中打印k个单词的花费是，M是一个常数。如何安排文章，才能最小化费用？
输入：有很多测试用例。对于每个测试用例，第一行中都有两个数字N和M（0≤n≤500000，0≤M≤1000）。然后，在接下来的2到N + 1行中有N个数字。输入用EOF终止。
输出：一个数字，表示打印文章的最低费用。
样例输入：
5 5
5
9
5
7
5
样例输出：
230

题目的意思是：有NNN个数和一个常数MMM，把这NNN个数分成若干部分，每一部分的计算值为这部分数的和的平方加上MMM，总计算值为各部分计算值之和，求最小的总计算值。由于NNN很大，O(N2)O(N^2)O(N2)的算法超时。
设dp[i]dp[i]dp[i]表示输出前iii个单词的最小费用，DP转移方程：
dp[i]=min{dp[j]+(sum[i]−sum[j])2+M}dp[i] = min\{dp[j] + (sum[i]-sum[j])2 + M\}dp[i]=min{dp[j]+(sum[i]−sum[j])2+M} 0<j<i0<j<i0<j<i
其中sum[i]sum[i]sum[i]表示前iii个数字和。
下面把DP方程改写为y=kx+by = kx + by=kx+b的形式。首先展开方程：
dp[i]=dp[j]+sum[i]∗sum[i]+sum[j]∗sum[j]−2∗sum[i]∗sum[j]+Mdp[i] = dp[j] + sum[i]*sum[i] + sum[j]*sum[j] - 2*sum[i]*sum[j] + Mdp[i]=dp[j]+sum[i]∗sum[i]+sum[j]∗sum[j]−2∗sum[i]∗sum[j]+M
移项得：
dp[j]+sum[j]∗sum[j]=2∗sum[i]∗sum[j]+dp[i]−sum[i]∗sum[i]−Mdp[j] + sum[j]*sum[j] = 2*sum[i]*sum[j] + dp[i]-sum[i]*sum[i] - Mdp[j]+sum[j]∗sum[j]=2∗sum[i]∗sum[j]+dp[i]−sum[i]∗sum[i]−M
对照y=kx+by = kx + by=kx+b，有：
y=dp[j]+sum[j]∗sum[j]y = dp[j] + sum[j]*sum[j]y=dp[j]+sum[j]∗sum[j]，yyy只和jjj有关。
x=2∗sum[j]x = 2*sum[j]x=2∗sum[j]，xxx只和jjj有关，且随着jjj递增而递增。
k=sum[i]k = sum[i]k=sum[i]，kkk只和jjj有关，且随着iii递增而递增。
b=dp[i]−sum[i]∗sum[i]−Mb = dp[i] - sum[i]*sum[i] - Mb=dp[i]−sum[i]∗sum[i]−M，bbb只和i有关，且包含dp[i]dp[i]dp[i]。
下面给出代码。
#include using namespace std; const int MAXN = 500010; int dp[MAXN]; int q[MAXN]; //单调队列 int sum[MAXN]; int X(int x){ return 2*sum[x]; } int Y(int x){ return dp[x]+sum[x]*sum[x]; } //double slope(int a,int b){return (Y(a)-Y(b))/(X(a)-X(b));} //除法不好，改成下面的乘法 int slope_up (int a,int b) { return Y(a)-Y(b);} //斜率的分子部分 int slope_down(int a,int b) { return X(a)-X(b);} //斜率的分母部分 int main(){ int n,m; while(~scanf("%d%d",&n,&m)){ for(int i=1;i<=n;i++) scanf("%d",&sum[i]); sum[0] = dp[0] = 0; for(int i=1;i<=n;i++) sum[i]+=sum[i-1]; int head=1,tail=1; //队头队尾 q[tail]=0; for(int i=1;i<=n;i++){ while(head<tail && slope_up(q[head+1],q[head])<=sum[i]*slope_down(q[head+1],q[head])) head++; //斜率小于k，从队头弹走 int j = q[head]; //队头是最优点 dp[i] = dp[j]+m+(sum[i]-sum[j])*(sum[i]-sum[j]); //计算dp[i] while(head<tail && slope_up(i,q[tail])*slope_down(q[tail],q[tail-1]) <= slope_up(q[tail],q[tail-1])*slope_down(i,q[tail])) tail--; //弹走队尾不合格的点 q[++tail] = i; //新的点进队尾 } printf("%d\n",dp[n]); } return 0; } 5. 习题
（1）洛谷P3195 玩具装箱 https://www.luogu.com.cn/problem/P3195
DP方程：dp[i]=min{dp[j]+(sum[i]+i−sum[j]−j−L−1)2}dp[i]=min\{dp[j]+(sum[i]+i−sum[j]−j−L−1)^2\}dp[i]=min{dp[j]+(sum[i]+i−sum[j]−j−L−1)2}

（2）洛谷4072 SDOI2016征途 https://www.luogu.com.cn/problem/P4072
二维斜率优化，DP方程：dp[i][p]=min{dp[j][p−1]+(s[i]−s[j])2}dp[i][p]=min\{dp[j][p−1]+(s[i]−s[j])^2\}dp[i][p]=min{dp[j][p−1]+(s[i]−s[j])2}

作者：罗勇军

dp 算法

1024 个赞

编辑举报

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Python3 迭代器与生成器

Serafina 2021-03-06

813

asp 使用正则表达式替换word中的标签，转为纯文本

Iona 2021-07-23

518

TypeScript实现十大排序算法之归并排序示例详解

Eranthe 2023-02-26

1344

Java中常见的查找算法与排序算法总结

Elita 2023-03-13

30

详解MD5算法的原理以及C#和JS的实现

Shaine 2023-03-17

106

详解SHA-256算法的原理以及C#和JS的实现

Nafisa 2023-03-29

1633

Matlab中图像数字水印算法的原理与实现详解

Thalia 2023-04-14

910

JVM的内存回收及常见算法小结

Tanisha 2023-05-02

1620

C# AStar寻路算法详解

Angie 2023-05-12

1571

C#中使用CAS实现无锁算法的示例详解

Jacinda 2023-05-13

1688

Python图像处理之图像增广算法详解

Malina 2023-05-13

1051

Java服务限流算法的6种实现

Kefira 2023-05-13

1926

Swin Transformer模块集成到YOLOv5目标检测算法中实现

Rhea 2023-05-31

411

8种Python异常检测算法总结

Pandora 2023-06-06

1433

MySQL中Join的算法(NLJ、BNL、BKA)详解

Trixie 2023-07-20

343

排序算法之插入排序法解析

Hester 2023-07-20

301

排序算法之希尔排序法解析

Ianthe 2023-07-20

1837

Python使用嵌套循环实现图像处理算法

Valora 2023-07-20

1314

C语言实现哈希搜索算法及原理详解

Radinka 2023-07-20

1280

使用Golang如何实现简易的令牌桶算法

Tertia 2023-07-21

1096

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。
软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座