那个下棋很厉害的阿尔法狗 玩游戏也不赖

你可能不知道,在 AlphaGo 学会下围棋之前,它其实在玩游戏上已经超越了很多人类的。

更新:北京时间3月15日下午,阿尔法狗在与李世石的最后一轮较量中获胜,本次人机围棋大战总比分定格为1:4。那一天人类回想起了被狗虐的感伤……

  最近,谷歌旗下 DeepMind 的最新开发的人工 AI 阿尔法狗(AlphaGo)挑战韩国围棋高手李世乭的消息,想必大家都知道了。截稿时,双方五局比赛中,人类已经输了三局,围棋作为很长时间以来,人类智力的顶级试炼石已经遭到了机器的挑战。

  然而在你可能不知道,在 AlphaGo 学会下围棋之前,它其实在玩游戏上已经超越了很多人类。

  2015年,Deep Mind 公布了 AlphaGo 的前身的学习成果。那时候它的名字还叫“自己学习游戏规则的人工智能”。谷歌在没有给予任何游戏相关情报和规则指示的情况下,让 AI 游玩了49款规则不同的游戏,其中29款的成绩明显的高于人类玩家水平。下面《打砖块》就是其中一个例子。


▲训练100场


▲训练200场


▲训练400场


▲训练600场,已经会使用策略了

▲完整视频

  虽然它名字很绕口,但是其强大的学习能力早在那时候就体现出来了。

  记得《杀出重围》之父 Warren Spector 经常说,主流游戏这么多年来都没有什么革命性的进步。其实这话还是挺有道理的,虽然我们觉得电子游戏的 AI 水平一直在进步,但事实上它们仍旧遵循的是程序员在游戏中设定好的固有逻辑与反应,并没有随着时间学习与进步。

  试想如果把 AlphaGo 所使用的技术运用到游戏中,尤其是运用到电竞当中,你觉得你在《英雄联盟》里还能用人机来练手吗?_(:з」∠)_

  其实也不用担心,要知道 AlphaGo 强大运算能力的背后依靠的是1202个 CPU 和176个 GPU 堆起来的,他们加起来的能耗远超200000W,一般的人家里的电脑肯定没有这等运算能力。与之相对的,人脑的能耗一般低于30W,至少在效率上我们是完胜的。

  最后肯定有人问,为什么昨天人类好不容易扳回一局你不说?

  是这样的,世界职业围棋排名网站 GoRatings.org 有一个规则,如果一个围棋选手,正式出道之后从未输过任何一场棋局,那么这个围棋选手是不会计入到这个排名统计的。

  而正是因为如此,DeepMind 的工程师 Raia Hadesell 昨天在 Facebook 上公开表示:“AlphaGo 现在可以有正式排名了。(谢谢输给你,李世石,如果一直赢棋就不能被排名算法统计)。现在 AlphaGo 积分是3533分,排名世界第四。”


AlphaGo进入榜单,排名第四


▲韩国为AlphaGo颁发的围棋九段证书

  所以,到底是谁算计了谁呢?

THE END
分享
二维码
< <上一篇
下一篇>>