通过时间反向传播

就是普通地计算一下期望
0*(1-pi)+ 1/pi * pi = 1