‘这其中最重要的方面……是AlphaGo不仅仅是一个手动规则构建下的专门系统,’负责DeepMind监督的戴密斯·哈萨比斯说,‘相反,它还使用通用的机器学习技术来赢得胜利。’
1、穷举与剪枝
早在2014年初,库伦的围棋程序Crazystone就挑战了日本的职业棋手依田纪基并获得了胜利,但有一点需要声明——这是AI在受让四子的情况下。
在围棋中,这代表着开局的巨大优势。
当时,库伦预测,机器还需要10年的发展,才能在分先的情况下赢得顶尖棋手。
这项研究的难度在于围棋规则本身。
即使是功能再强大的超级计算机,处理能力也有极限,无法在给定任意的合理的时间内分析出棋盘中可行的每步棋着的变化。
当深蓝在1997年战胜国际象棋冠军卡斯帕罗夫时,就是以这样的‘暴力’做到的。
从本质上讲,IBM的超级计算机分析了当前可行的每一步棋的结果,这样的预测视野超越了人类棋手的极限。
但在围棋中,这是不可能做到的。
在国际象棋中,任意给定的回合平均约有35种可行的变化;而围棋--这种两个玩家在19×19的网格上以抛光的棋子互相对抗的游戏,有着约250种变化,并且每种都能生出另外的250种,依此类推,无法穷尽。
内容未完,下一页继续阅读