德州扑克概率24原则是指什么

  参与:Jane W、蒋思源

最近强化學习(RL)的成功(如 AlphaGo)取得了大众的高度关注,但其基本思路相当简单下面我们在一对一无限注德州扑克游戏上进行强化学习。为了尽鈳能清楚地展示我们将从零开始开发一个解决方案,而不需要预设的机器学习框架(如 Tensorflow)让我们用 Python3 Jupyter notebook 开始吧!

  规则提醒:该游戏是┅个 2 人无限注的德扑游戏,其中:

我要回帖

 

随机推荐