其他分享
首页 > 其他分享> > 【动态规划】有后效性 DP

【动态规划】有后效性 DP

作者:互联网

P3232 [HNOI2013]游走

\(\text{Description}\)

给定一个 \(n\) 个点 \(m\) 条边的无向连通图。从 \(1\) 号节点出发,每一步以相等的概率 随机 选择当前节点连出去的某条边,经过这条边走到下一个节点,获得等于这条边的编号的分数。到达 \(n\) 号顶点时结束。请对这 \(m\) 条边进行编号,使得获得的总分的期望值 最小

\(\text{Solution}\)

考虑 \(\rm dp\),设 \(f_u\) 表示到达节点 \(u\) 的期望次数,\(g_i\) 表示经过边 \(i\) 的期望次数,\(d_u\) 表示节点 \(u\) 的度数。

对于图中的一条边 \((u,v)\),\(v\) 连出去 \(d_v\) 条边,只有一种情况会经过 \((u,v)\),所以有 \(\dfrac{f_v}{d_v}\) 种。

还要注意:

所以有

\[f_u= \begin{cases} \sum\limits_{(u,v)\in E,v\ne n}\dfrac{f_v}{d_v}+1&u=1\\ \sum\limits_{(u,v)\in E,v\ne n}\dfrac{f_v}{d_v}&u\ne1,u\ne n \end{cases} \]

对于边 \((u,v)\),有可能是从 \(u\) 过来的,也有可能是从 \(v\) 过来的。

\[g_{(u,v)}=\dfrac{f_u}{d_u}+\dfrac{f_v}{d_v}\quad u\ne n,v\ne n \]

然后将 \(g\) 进行排序,贪心地选择即可。

但是我们发现一个问题,\(f_v\) 可以推到 \(f_u\),而更新后的 \(f_u\) 又能推到 \(f_v\),这样就没法处理了。我们把这种问题称为 有后效性 \(\rm dp\)

怎么处理呢?

我们举个例子,假设是这样一张图:

除 \(5\) 号点之外:

\[\begin{cases} f_1=\dfrac{f_2}{d_2}+\dfrac{f_3}{d_3}+1\\ f_2=\dfrac{f_1}{d_1}+\dfrac{f_4}{d_4}\\ f_3=\dfrac{f_1}{d_1}\\ f_4=\dfrac{f_2}{d_2} \end{cases} \]

我们整理一下这个方程组:

\[\begin{cases} 1\cdot f_1-\dfrac{1}{d_2}\cdot f_2-\dfrac{1}{d_3}\cdot f_3+0\cdot f_4=1\\ -\dfrac{1}{d_1}\cdot f_1+1\cdot f_2+0\cdot f_3-\dfrac{1}{d_4}\cdot f_4=0\\ -\dfrac{1}{d_1}\cdot f_1+0\cdot f_2+1\cdot f_3+0\cdot f_4=0\\ 0\cdot f_1-\dfrac{1}{d_2}\cdot f_2+0\cdot f_3+1\cdot f_4=0 \end{cases} \]

这就是一个 \((n-1)\) 元一次方程组,高斯(-约旦)消元即可。

时间复杂度 \(\mathcal{O}(n^3)\)。

\(\text{Code}\)

#include <iostream>
#include <cstdio>
#include <cmath>
#include <algorithm>
typedef double db;
using namespace std;

const int MAXN = 505;
const int MAXM = 125005;

int cnt;
int head[MAXN], st[MAXM], ed[MAXM], d[MAXN];

struct edge
{
	int to, nxt;
}e[MAXM << 1];

void add(int u, int v)
{
	e[++cnt] = edge{v, head[u]};
	head[u] = cnt;
	d[u]++;
}

int n, m;
db a[MAXN][MAXN];
db f[MAXN], g[MAXM];

void Gauss_Jordan()
{
	for (int i = 1; i <= n; i++)
	{
		int mx = i;
		for (int j = i + 1; j <= n; j++)
		{
			if (fabs(a[j][i]) > fabs(a[mx][i]))
			{
				mx = j;
			}
		}
		if (mx != i)
		{
			swap(a[i], a[mx]);
		}
		for (int j = 1; j <= n; j++)
		{
			if (j != i)
			{
				db val = a[j][i] / a[i][i];
				for (int k = i + 1; k <= n + 1; k++)
				{
					a[j][k] -= a[i][k] * val;
				}
			}
		}
	}
	for (int i = 1; i <= n; i++)
	{
		f[i] = a[i][n + 1] / a[i][i];
	}
}

bool cmp(double x, double y)
{
	return x > y;
}

int main()
{
	scanf("%d%d", &n, &m);
	for (int i = 1; i <= m; i++)
	{
		scanf("%d%d", st + i, ed + i);
		add(st[i], ed[i]);
		add(ed[i], st[i]);
	}
	n--;
	for (int u = 1; u <= n; u++)
	{
		a[u][u] = 1;
		for (int i = head[u]; i; i = e[i].nxt)
		{
			int v = e[i].to;
			if (v != n + 1)
			{
				a[u][v] = -1.0 / d[v];
			}
		}
		if (u == 1)
		{
			a[u][n + 1] = 1;
		}
	}
	Gauss_Jordan();
	for (int i = 1; i <= m; i++)
	{
		g[i] = f[st[i]] / d[st[i]] + f[ed[i]] / d[ed[i]];
	}
	sort(g + 1, g + m + 1, cmp);
	db ans = 0;
	for (int i = 1; i <= m; i++)
	{
		ans += i * g[i];
	}
	printf("%.3lf\n", ans);
	return 0;
}

标签:后效,include,int,dfrac,ne,cdot,cases,动态,DP
来源: https://www.cnblogs.com/mangoworld/p/DP-with-Aftereffect.html