AlphaGo

一文詳解AlphaGo原理

摘要 1、圍棋是一個MDPs問題 2、policy iteration如何求解MDPs問題? 3、WHAT and WHY is MonteCarlo method? 4、AlphaGo

1715292530.0977