今天下午,谷歌人工智能“阿法狗”(AlphaGo)又双叒赢了韩国九段棋手李世石,连赢三局的AlphaGo已经奠定了完胜的结果。那么,“阿法狗”为什么能完胜人类?其中的奥秘来看看这个美女国际裁判是怎么说的吧!
↑点击上图进入“李世石会不会0比5被机器人KO?快来问她吧!”↑
AlphaGo什么来头?
谷歌在2014年1月花4亿美元收购DeepMind,但这家位于英国伦敦的人工智能公司一直保持神秘低调——直到这一回AlphaGo一鸣惊人,成为第一个在不让子的情况下击败职业围棋手的围棋AI。
与一般围棋AI惯于采用的蒙特卡洛树搜索技术进行对弈分析不同,AlphaGo主要基于深度学习技术(Deep Learning),依赖2种不同的深度神经网络:“策略网络”(policy network)和“值网络”(value network)作出判断。这两者会合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。此外,AlphaGo还要“通读”各种专业棋局,并和自己对弈,以不断精进棋力。
AlphaGo的“幕后老板”还想攻克哪些目标?
虽然AlphaGo此次的战绩让围棋界慌了神,不过对于DeepMind来说只是成功的一小步,毕竟该公司的目标可是“搞定智能”,然后用它们来“搞定任何事情”。因此除了围棋,DeepMind还在不少其他领域掺了一脚。
1月13日,DeepMind的创始人Demis Hassabis和Mustafa Suleyman就参与了对初创公司Babylon Health的投资,与其他投资者一起投入了约2500万美元。Babylon Health是一款帮助患者通过手机资讯医生的APP,将在2个月后推出AI版本,让APP能自主询问患者病情,然后给出健康建议。
在AlphaGo亮相之前,DeepMind还将人工智能运用于电子游戏领域,开发出了Deep Q-network(DQN),通过“深度学习”技术,让DQN学习、掌握《Space Invaders》《Breakout》等游戏。根据DeepMind公布的试验视频可以看到,DQN在最初开始《Breakout》游戏时几乎是屡战屡败,不太会操作移动浮板反弹小球。400次游戏后,DQN已经能灵活操控浮板进行游戏,而在进行了600次游戏后,DQN已经学会使用技巧,通过将小球弹射到砖块上方来消除更多砖块。
点此查看DeepMind人工智能DQN玩《Breakout》游戏
根据2015年2月DeepMind在《自然》杂志上刊登的文章显示,人工智能DQN已学会了49种电子游戏,从军事游戏到3D赛车游戏,它都能轻松驾驭。“(现在人工智能玩儿的)只是游戏,不过在未来可以是股市数据。”DeepMind联合创始人Demis Hassabis表示。
除了AlphaGo,还有哪些AI棋手?
其实在AlphaGo之前,就有不少围棋AI曾挑战或打败过人类棋手。在公开的围棋服务器KGS中,就潜藏着不少围棋软件,其中许多都战绩斐然。
Crazy Stone
由法国程序员Rémi Coulom研发的围棋程序Crazy Stone是第一批基于蒙特卡洛树搜索技术的围棋AI。2013年,在职业棋手和冠亚军软件对弈的电圣战首届比赛中,Crazy Stone曾被让4子战胜棋手石田芳夫九段;2014年东京围棋擂台赛上,Crazy Stone曾通过让子以微弱优势战胜人类棋手;而在2015年的UEC围棋软件大赛中,它也第4次蝉联冠军。目前,Crazy Stone在公开的围棋服务器KGS上被评为六段水平(KGS等级而非围棋段位)。
DolBaram
DolBaram由韩国人工智能专家林宰范(Lim Jaebum)开发,是2015年的UEC围棋软件大赛的亚军。另外,在2015年3月举办的第3届电圣战比赛上,棋手赵治勋九段让四子不敌DolBaram。
ZEN
围棋软件ZEN是由日本程序员尾岛阳儿及其研发小组TeamDeepZEN开发、改进的,多次斩获UEC围棋软件大赛的冠、亚军。2011年ZEN以被让六子分别迎来棋手周俊勋九段和郑铭瑝九段,2012年3月,棋手武宫正树九段分别让五子、让四子,但两度败在围棋软件ZEN的手里。截至1月29日,ZEN在KGS百强排行榜中位列第95位,等级为七段。
银星(KCC IGO)
朝鲜围棋软件银星是公认的世界前三的围棋人工智能程序。和AlphaGo一样,银星也具有自主学习的功能,可以记忆使用者的棋风,在失败以后可以自动调整。
Pachi
来自捷克的围棋软件Pachi实力可达到KGS七段水平,曾被让6子赢棋手周俊勋九段。
Darkforest
在AlphaGo大出风头之后,Facebook也不甘示弱,立马表示自家的Darkforest也是棋艺卓群。这一款围棋人工智能是由Facebook人工智能实验室(FAIR)所研发的,采用的是卷积神经网络和蒙特卡洛树搜索相结合的技术,主要通过模仿人类选手、分析识别大量专业选手比赛数据等方式来增进棋艺。根据扎克伯格的说法,在过去6个月,Darkforest已能够以每步0.1秒对弈。目前,Darkforest已在KGS服务器上运营了一个多月,在KGS上达到三段,并取得了成人组第五的排名。
My Go
中国也有围棋软件My Go,开发者是中南大学的武坤教授,曾夺得过2014及2015年中国计算机博弈大赛九路围棋的冠军,不过在十九路围棋领域,My Go还实力欠佳。
虽然竞争对手众多,但以目前DeepMind公布的数据来看,AlphaGo在众围棋AI中实力稳居第一:AlphaGo和其他的围棋AI进行较量,在总计495局中只输了一局,胜率是99.8%,并尝试让4子对阵Crazy Stone、Zen和Pachi,胜率分别是77%、86%和99%。