首页 > 代码库 > hdu-4089-Activation-概率dp

hdu-4089-Activation-概率dp

kuangbin题解写的很好,我就不赘余了。。

一下解释来自kuangbin:

题意:有n个人排队等着在官网上激活游戏。Tomato排在第m个。
对于队列中的第一个人。有一下情况:
1、激活失败,留在队列中等待下一次激活(概率为p1)
2、失去连接,出队列,然后排在队列的最后(概率为p2)
3、激活成功,离开队列(概率为p3)
4、服务器瘫痪,服务器停止激活,所有人都无法激活了。
求服务器瘫痪时Tomato在队列中的位置<=k的概率


解析:
概率DP;
设dp[i][j]表示i个人排队,Tomato排在第j个位置,达到目标状态的概率(j<=i)
dp[n][m]就是所求
j==1:    dp[i][1]=p1*dp[i][1]+p2*dp[i][i]+p4;
2<=j<=k: dp[i][j]=p1*dp[i][j]+p2*dp[i][j-1]+p3*dp[i-1][j-1]+p4;
k<j<=i:  dp[i][j]=p1*dp[i][j]+p2*dp[i][j-1]+p3*dp[i-1][j-1];
化简:
j==1:    dp[i][1]=p*dp[i][i]+p41;
2<=j<=k: dp[i][j]=p*dp[i][j-1]+p31*dp[i-1][j-1]+p41;
k<j<=i:  dp[i][j]=p*dp[i][j-1]+p31*dp[i-1][j-1];


其中:
p=p2/(1-p1);
p31=p3/(1-p1)
p41=p4/(1-p1)


可以循环i=1->n 递推求解dp[i].在求解dp[i]的时候dp[i-1]就相当于常数了。
在求解dp[i][1~i]时等到下列i个方程
j==1:   dp[i][1]=p*dp[i][i]+c[1];
2<=j<=k:dp[i][j]=p*dp[i][j-1]+c[j];
k<j=i:  dp[i][j]=p*dp[i][j]+c[j];
其中c[j]都是常数了。上述方程可以解出dp[i]了。
首先是迭代得到 dp[i][i].然后再代入就可以得到所有的dp[i]了。


注意特判一种情况。就是p4<eps时候,就不会崩溃了,应该直接输出0。

#include<stdio.h>
#include<string.h>
#include<iostream>
#include<algorithm>
#include<queue>
#include<math.h>
using namespace std;
#define eps 1e-9
#define zero(x) ((fabs(x)<eps?0:x))
#define maxn 2200
double dp[maxn][maxn];
double c[maxn];
double p[maxn];
int main()
{
    int n,m,k;
    double p1,p2,p3,p4;
    while(~scanf("%d%d%d%lf%lf%lf%lf",&n,&m,&k,&p1,&p2,&p3,&p4))
    {
        if(p4<eps)
        {
            puts("0.00000");
            continue;
        }
        double p21=p2/(1-p1);
        double p41=p4/(1-p1);
        double p31=p3/(1-p1);
        p[0]=1.0;
        for(int i=1;i<=n;i++)p[i]=p[i-1]*p21;
        dp[1][1]=p41/(1-p21);
        for(int i=2;i<=n;i++)
        {
            double tmp=p[i-1]*p41;
            for(int j=2;j<=k&&j<=i;j++)c[j]=p31*dp[i-1][j-1]+p41;
            for(int j=k+1;j<=i;j++)c[j]=p31*dp[i-1][j-1];
            for(int j=2;j<=i;j++)tmp+=p[i-j]*c[j];
            dp[i][i]=tmp/(1-p[i]);
            dp[i][1]=p21*dp[i][i]+p41;
            for(int j=2;j<i;j++)dp[i][j]=p21*dp[i][j-1]+c[j];
        }
        printf("%.5f\n",dp[n][m]);
    }
    return 0;
}