其他分享
首页 > 其他分享> > [Codeforces 464D]World of Darkraft(期望DP)

[Codeforces 464D]World of Darkraft(期望DP)

作者:互联网

[Codeforces 464D]World of Darkraft(期望DP)

题面

游戏中有k种装备,每种装备初始时都是等级1。zyd每打一只怪,就会随机爆出一件装备。掉落和更新装备方式如下:

假设这种装备当前等级为t,那么系统会在[1,t+1]中等概率随机出该装备的等级。爆出装备后,会装备上身上的和爆出的装备之间等级更高的那件,并卖掉等级更低的装备。其中等级为i的装备价格为i金币。

求打了n只怪后获得金币的期望值,精确到\(10^{-9}\)。

\(n,k\leq 10^5\)

分析

首先,所有装备没有区别。根据期望的线性性可以计算出买某种装备的期望收益,再乘上\(k\)

设\(dp[i][j]\)表示某种装备现在\(j\)级,再打\(i\)只怪后的期望收益

考虑从\(i-1\)推到\(i\)(注意:这实际上是倒推),分情况讨论:

  1. 爆出的不是这种装备,概率\(\frac{k-1}{k}\),期望\(\frac{k-1}{k}dp[i-1][j]\)

  2. 爆出的是这种装备,概率\(\frac{1}{k}\)
    2.1 爆出的装备等级为\(j+1\),概率为\(\frac{1}{j+1}\),此时把当前装备卖掉获得\(j\)金币。那么倒推期望,从\(dp[i-1][j+1]\)转移过来,期望\(\frac{j+dp[i-1][j+1]}{j+1}\)

    2.2爆出的装备等级为\([1,j]\)中的一个,概率\(\frac{j}{j+1}\).卖掉这个装备,由于概率均匀分布,获得金币的期望值为\(\frac{j+1}{2}\)。此后手上装备等级还是\(j\),从\(dp[i-1][j]\)转移,期望\(\frac{j}{j+1}(dp[i-1][j]+\frac{j+1}{2})\)

那么我们可以写出最终的dp方程

\(dp[i][j]=\frac{k-1}{k}dp[i-1][j]+\frac{1}{k}(\frac{j+dp[i-1][j+1]}{j+1}+\frac{j}{j+1}(dp[i-1][j]+\frac{j+1}{2}))\)

这样的转移是\(O(n^2)\)的.想到期望dp的一般套路,j过大的时候期望值小到可以忽略不计。经过测试j枚举到700即可。严谨的证明请参考cf官方题解

代码

#include<iostream>
#include<cstring>
#include<cmath>
#include<cstdio>
#define maxb 700
using namespace std;
typedef double db;
int n;
db k;
db dp[2][maxb+5];
int main(){
    scanf("%d %lf",&n,&k);
    int now=0;
    for(int i=1;i<=n;i++){
        for(int j=1;j<=maxb;j++){
            dp[now][j]=dp[now^1][j]*(k-1.0)/db(k)
                       +((dp[now^1][j+1]+j)/(j+1.0)
                       +(dp[now^1][j]+(j+1)/2.0)*j/(j+1.0))/db(k);
        }
        now^=1;
    }
    printf("%.10lf\n",k*dp[now^1][1]);
}
                

标签:frac,Darkraft,装备,Codeforces,464D,期望,等级,爆出,dp
来源: https://www.cnblogs.com/birchtree/p/12266236.html