Google AI 子公司 DeepMind 的研究人员本月早些时候发表论文,宣布他们的 AI 程序从 AlphaGo Zero 进化到了 AlphaZero,利用自对弈增强学习在数小时内打败了顶尖的国际象棋和日本将棋程序。那么 AlphaZero 是否代表着 AI 领域的一大突破?一位 AI 研究人员认为 DeepMind 的研究存在很多可质疑的地方。首先 AlphaZero 运用的方法不是新的,自对弈增强学习已经存在了几十年,蒙特卡罗树搜索也不是什么新事物。如果要指出进步之处,那就增强学习和蒙特卡罗树搜索的组合更可靠了。DeepMind 没有公开它的 AI 系统源代码,因此难以检验和重复它公布的结果。它的竞争对手 Stockfish 则是一个开源的国际象棋程序,在对战中 DeepMind 没有使用 Stockfish 的最新版本,更重要的是它运行在普通的 PC 上,而 AlphaZero 运行的是专门设计的处理器 TPU,效率远甚于传统 CPU。比赛设置也非常不公平,每一步只给出一分钟的思考时间,AlphaZero 速度更快能思考更多走法,而 Stockfish 明显在运算上处于劣势。
本文永久更新链接地址:http://www.linuxidc.com/Linux/2017-12/149491.htm