你好,游客 登录 注册 搜索
背景:
阅读新闻

AlphaGo 进化到 Zero,不靠人类靠自学

[日期:2017-10-19] 来源:solidot.org  作者:Linux [字体: ]

Google 旗下的 AI 子公司 DeepMind 在《自然》期刊上发表了最新的论文(PDF),介绍了它的围棋 AI AlphaGo Zero。DeepMind 开发的前几个版本的围棋 AI 如 AlphaGo Fan(打败樊麾的版本)、AlphaGo Lee(打败李世石的版本),AlphaGo Master (打败柯洁的版本)都需要人类知识训练,但进化到 Zero 的版本则从零开始完全通过自我学习,3 天后超过 AlphaGo Lee,取得了 100 胜 0 负的成绩,21 天后达到 AlphaGo Master 的水平,40 天后成为史上最强大的围棋选手。DeepMind 认为通用 AI 能帮助人类解决其面临的部分最具有挑战性的难题。DeepMind 称,AlphaGo Zero 只使用一个神经网络,而先前版本的 AlphaGo 使用了策略网络和价值网络判断落子,而 AlphaGo Zero 通过强化学习将两者结合在一起,能更有效的训练和评估,它所需的计算资源也比前几代要少:AlphaGo Fan 使用了 176 个 GPU ,AlphaGo Lee 使用了 48 个 TPU,AlphaGo Master 使用了 4 个 TPU,比 Master 更强的 Zero 也是使用 4 个 TPU。

本文永久更新链接地址http://www.linuxidc.com/Linux/2017-10/147793.htm

linux
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款