首页 > 代码库 > hdu-4089-Activation-概率dp
hdu-4089-Activation-概率dp
kuangbin题解写的很好,我就不赘余了。。
一下解释来自kuangbin:
题意:有n个人排队等着在官网上激活游戏。Tomato排在第m个。
对于队列中的第一个人。有一下情况:
1、激活失败,留在队列中等待下一次激活(概率为p1)
2、失去连接,出队列,然后排在队列的最后(概率为p2)
3、激活成功,离开队列(概率为p3)
4、服务器瘫痪,服务器停止激活,所有人都无法激活了。
求服务器瘫痪时Tomato在队列中的位置<=k的概率
解析:
概率DP;
设dp[i][j]表示i个人排队,Tomato排在第j个位置,达到目标状态的概率(j<=i)
dp[n][m]就是所求
j==1: dp[i][1]=p1*dp[i][1]+p2*dp[i][i]+p4;
2<=j<=k: dp[i][j]=p1*dp[i][j]+p2*dp[i][j-1]+p3*dp[i-1][j-1]+p4;
k<j<=i: dp[i][j]=p1*dp[i][j]+p2*dp[i][j-1]+p3*dp[i-1][j-1];
化简:
j==1: dp[i][1]=p*dp[i][i]+p41;
2<=j<=k: dp[i][j]=p*dp[i][j-1]+p31*dp[i-1][j-1]+p41;
k<j<=i: dp[i][j]=p*dp[i][j-1]+p31*dp[i-1][j-1];
其中:
p=p2/(1-p1);
p31=p3/(1-p1)
p41=p4/(1-p1)
可以循环i=1->n 递推求解dp[i].在求解dp[i]的时候dp[i-1]就相当于常数了。
在求解dp[i][1~i]时等到下列i个方程
j==1: dp[i][1]=p*dp[i][i]+c[1];
2<=j<=k:dp[i][j]=p*dp[i][j-1]+c[j];
k<j=i: dp[i][j]=p*dp[i][j]+c[j];
其中c[j]都是常数了。上述方程可以解出dp[i]了。
首先是迭代得到 dp[i][i].然后再代入就可以得到所有的dp[i]了。
注意特判一种情况。就是p4<eps时候,就不会崩溃了,应该直接输出0。
#include<stdio.h> #include<string.h> #include<iostream> #include<algorithm> #include<queue> #include<math.h> using namespace std; #define eps 1e-9 #define zero(x) ((fabs(x)<eps?0:x)) #define maxn 2200 double dp[maxn][maxn]; double c[maxn]; double p[maxn]; int main() { int n,m,k; double p1,p2,p3,p4; while(~scanf("%d%d%d%lf%lf%lf%lf",&n,&m,&k,&p1,&p2,&p3,&p4)) { if(p4<eps) { puts("0.00000"); continue; } double p21=p2/(1-p1); double p41=p4/(1-p1); double p31=p3/(1-p1); p[0]=1.0; for(int i=1;i<=n;i++)p[i]=p[i-1]*p21; dp[1][1]=p41/(1-p21); for(int i=2;i<=n;i++) { double tmp=p[i-1]*p41; for(int j=2;j<=k&&j<=i;j++)c[j]=p31*dp[i-1][j-1]+p41; for(int j=k+1;j<=i;j++)c[j]=p31*dp[i-1][j-1]; for(int j=2;j<=i;j++)tmp+=p[i-j]*c[j]; dp[i][i]=tmp/(1-p[i]); dp[i][1]=p21*dp[i][i]+p41; for(int j=2;j<i;j++)dp[i][j]=p21*dp[i][j-1]+c[j]; } printf("%.5f\n",dp[n][m]); } return 0; }