瀏覽單個文章
capitalm
Major Member
 
capitalm的大頭照
 

加入日期: Jun 2003
您的住址: where the light is
文章: 271
因為 aX^2 + bx 不是一個線性的函數,不能直接用 X 的期望值來算
要回到 reward 期望值的基本定義
E[reward] = 所有的 (ai^2+b^i)*p[i] 加總
 
舊 2005-11-08, 01:11 AM #2
回應時引用此文章
capitalm離線中