谷歌"星际Alpha go":探索未来AI

www.replays.net/作者:

在北京时间11月5日进行的2016暴雪嘉年华开幕式上,暴雪宣布了有关Deepmind人工智能与《星际争霸2》在未来领域关于AI人工智能的发展计划。

谷歌研究科学家Oriol Vinyals登台简述了有关谷歌Deepmind人工智能与《星际争霸2》紧密合作的最新进展及未来的计划,他透露,谷歌正在研制新一代的人工智能,将在未来的《星际争霸2》中为玩家、甚至是全人类带来帮助,以及像不久前Alpha Go与人类对弈围棋一样,和人类挑战《星际争霸2》。

星际2改变世界!暴雪与谷歌公布未来人工智能计划谷歌人工智能团队Oriol Vinyals登场宣布未来星际2人工智能计划

11月6日的暴雪嘉年华星际2人工智能未来座谈会上,暴雪星际2工程师Kevin Calderone与谷歌DeepMind团队科研人员Oriol Vinyals具体讲述了这个未来“星际2 Alpha Go”的具体计划。

本文小编将用9句话简单概括暴雪与谷歌的这项星际2人工智能计划,并用简单易懂的语言为大家讲解这项科学计划。


谷歌的DeepMind团队设计《星际争霸2》“Alpha Go”的最终目的,并不是像围棋那样击败人类最强者,而是为了探索未来智能AI的研究方法。

Oriol Vinyals在演讲中提到,虽然不久前DeepMind团队研制出的Alpha Go和更早之前的深蓝打赢了人类最强的围棋选手,但目前他们研究的星际2人工智能,不再只是以打败人类这样狭隘的目标。

DeepMind期望通过开发星际2的人工智能,来研究未来人工智能如何应对更加复杂化的环境,去针对现实生活中各种复杂情况作出正确的动作决策、应激手段等。

期待!AlphaGo未来有望挑战《星际争霸2》选手
2011年,DeepMind公司创始人就曾宣布将挑战《星际争霸》的AI开发,但最后以失败告终

也就是说,研制星际2的人工智能是人类通往未来人工智能社会的一个阶梯,通过以“让机器人学习玩好星际2”的课题,来探索未来研发高级人工智能的方法。

围棋的Alpha Go只会下围棋,星际2的Alpha Go却能做的更多

从早期的深蓝电脑到Alpha Go击败围棋高手,DeepMind为深蓝和Alpha Go设定的目标仅仅是学会如何下围棋,但仅限于围棋范畴,所以即使这些人工智能虽然拥有简单的学习能力,但如果让它们去尝试玩最简单的扫雷,都学不会。

因此DeepMind期望未来研发的人工智能拥有更高级的学习能力,那么让人工智能去学着打星际2,就是首先要突破的一个目标。对于机器来说,围棋只局限于棋盘,只要机器拥有足够强大的计算能力和“经验积累”,那么它们的围棋水平就可以提高很快。

但对于星际2这样的游戏来说,则更加复杂,星际2并不如围棋那样能看清整个棋盘(地图),众所周知,星际2的开局地图被战争迷雾所覆盖,需要你去探索获取对手的动态。

9句话让你了解暴雪与谷歌的“星际Alpha Go”计划

所以简单的来说,相比围棋,星际2有更多更复杂的环境互动,以及更多的动作指令。

当然,更高级的学习能力只是其中之一。让星际2的智能AI不局限于脚本设计出的AI,还需要有记忆力、想象力和缜密的计划。如何制定一个计划以执行出战术,在对手家探路侦查后如何记忆住获取的信息并处理,这些都是基础。打好星际2的另一个关键性因素,就是知己知彼。一个出色的星际2选手,他在运营操作自己阵营的同时,还会同时判断对手此时的动态,如果星际2的智能AI想要变得强大,就需要像一流选手这样拥有一定的想象力。

未来的“星际2 AlphaGo”并不是操作非人类的“变态难度”对手

许多人提到未来星际2的Alpha Go,都会想到“悍马2000”。这个AI是之前玩家研制出的一种脚本AI,这种脚本AI能够计算游戏内的数据从而完成逆天的操作,比如机枪兵可以完美的一边分散后退一边甩枪,完成人类根本不可能完成的操作。这种操作对于只有两只手、肌肉反应和动作有限的人类来说,就算你苦练一百年,也无法做到。

所以对于之前“Alpha Go”和人类对决星际2的计划,大部分人的第一印象都是一个APM10000的机器人用各种逆天的操作和10线骚扰吊打人类。

请注意,这毫无意义,也并不是DeepMind想要研发的星际2 Alpha Go的目标。正如前文所说,谷歌的这项计划,更多的精力会投入在如何让Alpha Go学习打星际2并提高、应对星际2中复杂的战局情况。

星际2传统AI、我们心目中的“星际Alpha Go”以及谷歌期望的“星际 AlphaGo”是有明显区别的。 

我们先前说到了谷歌目标研发出的“星际2 Alpha Go”是不同于大部分人想象中那样操作逆天AI的。它不会有逆天的操作,只会有和人类一样甚至超出人类的学习能力。

9句话让你了解暴雪与谷歌的“星际Alpha Go”计划

暴雪工程师Kevin Calderone动画展示星际2中AI的算法

那么谷歌和暴雪共同研发的这款人工智能和现在星际2游戏里的AI电脑有什么不同呢?

暴雪星际2的工程师Kevin Calderone解释道,暴雪目前在游戏里设置的电脑AI是工程师们基于脚本设计出的,说到底,游戏里的AI还是十分死板,按照工程师制定的算法和玩家进行游戏。他们并没有学习能力。

为什么选择《星际争霸2》,因为它的难度和复杂程度有助于研究未来AI用于现实世界

不过有些事对于人类来说非常简单,但对于机器人来说却非常复杂。

比如Oriol Vinyals今天来到暴雪嘉年华演讲,他只需要准备一份演讲稿就可以了。而对于机器人来说,它需要先被植入一个上台演讲时间的脚本、制定一份如何走到讲台正确位置的路线等等。对于人类来说,他可以声情并茂的演讲出核心思想,知道哪些地方需要着重脱稿讲述,必要的时候还会下意识的作出一些手势让演讲更加精彩。而机器人恐怕很难做到这点,至少如今我们所能研发出的机器人,他只会生硬的朗读演讲稿。

这就是谷歌研究未来人工智能的一个攻坚举例,当然这和星际2有什么关系呢?

9句话让你了解暴雪与谷歌的“星际Alpha Go”计划DeepMind选择星际2作为研究的原因:

战争迷雾、操作空间、经济运营、及时性游戏、大局观、三个不同种族的互相对抗

星际2是当今世界上最复杂的一款即使战略游戏,运营流程、战术运用和针对、应激性操作这些不仅难度高,而且不像围棋那样套路固定,它需要根据对手的情况作出不同的改变。就如同搏击一般,招数只能让你掌握基础,而实战的千变万化则需要你通过经验的积累和扎实的基本功来千变万化。

所以对于DeepMind团队来说,这款游戏作为人工智能研发平台再适合不过了,人工智能在未来现实生活中想要帮助人类解决情况,自然会有许多难以预测的突发情况,所以它们必须要既作出正确的对策,还要根据实际情况细微的调整对策。

“星际2 Alpha Go”也会和人类一样犯错、纠错、学习、分析战局,然后变得更强

既然DeepMind提到了“通过星际2研发未来更高级的人工智能”这个伟大的目标,那么他们必然还会有更多复杂的技术攻坚。Oriol Vinyals说,他们将要研制的星际2人工智能,首先得学会如何去学会玩这款游戏,比如和新手玩家一样最基本的造兵、采矿发展、用什么样的战术、针对对手的战术。

9句话让你了解暴雪与谷歌的“星际Alpha Go”计划

星际2目前的AI可以指定多种战术,但都基于工程师脚本设计

接着就是如何做出更高级的动作了。这也是人类区别于其他动物或机器人的最显著特点,什么样的地图用什么样的战术,什么样种族的对手用什么样的战术、什么情况下适合快攻或是运营发展,这些概念化的东西则需要让人工智能和人类一样拥有学习和分析功能。想想都觉得好难...

所以,既然这款星际2的人工智能得核心是拥有学习能力,那么它一开始必然是个菜鸟,所以也会和人类一样犯错,但也会像人类一样纠正错误,去分析自己输在哪里,如何纠正错误,作出更加正确的决策,改进自己的应对策略。

让“星际2 Alpha Go”更加拟人化,也是DeepMind非常乐于研究的方向

前文也提到了这款人工智能会和人类一样犯错,当然在其他方面,DeepMind也更加期望人工智能在未来能更加像人,这样可以让在未来一天星际2的Alpha Go和人类顶尖选手挑战时更加公平。

所以DeepMind希望能像人类那样拥有一些生理机能上的限制。除了APM(每分钟操作数)限制到和人类相当,在精力分配上也尽量做到拟人化。比如说,此刻你的头脑一定不会去注意感知手上戴着的手表或是脖子上戴的项链。所以即使是世界上最强大的职业选手,他也无法保证时时刻刻能关注到比赛时战场上的每一个点,所以有时候他们也会因为精力分散而忽略一些地方的战局,比如过一段时间才会去拉走被对方骚扰的农民。DeepMind也希望能努力研究出这样拟人的犯错,而不是机械化的无时无刻对所有情况都作出应激反应。

趣味盘点:未来星际的AI对手该有哪些能力? 研发“星际2 Alpha GO”不仅可以当你的星际2教练,还可以在未来做你的生活助理

既然未来这款星际2人工智能这么牛掰,那么自然它不仅可以和你对抗,还可以教你如何打好星际2。它在未来可以为你分析你在玩星际2时的不足,帮助你提高,成为你的星际2教练。

当然,有了这样的技术手段,未来DeepMind也就很容易研究出在现实世界中也可以辅助你的人工智能。成为你的生活助理,就像星际2中的人类副官。

Oriol Vinyals通过自己的谷歌公司举了个简单的例子,未来可以让人工智能协助维护谷歌公司的服务器,以节省更多的能耗。但小到一个拧紧阀门盖的动作都需要人工智能作出及时的判断——阀门盖松动到什么程度,需要多大力气以及让阀门盖拧紧到什么程度这些都是视情况而定的,而无法通过固定脚本设定,具体怎么做?先从复杂的星际2里找答案。

现在“星际Alpha Go”的研究进度才刚刚起步。

为了探索未来更高级的人工智能,DeepMind选择从游戏切入,并列为主要研究方向,在此之前,DeepMind从最简单的红白机游戏开始尝试,让人工智能学会并精通简单的红白机游戏,再到复杂的3D游戏,最后再到复杂的《星际争霸2》。DeepMind在游戏中慢慢让人工智能学会通过像人类那样的记忆、空间想象能力来提高游戏水平。

但对于研发出星际2的Alpha Go来说,Oriol Vinyals则表示DeepMind才刚刚起步。谷歌与暴雪目前已经开始紧密合作,他们联合打造了一款协助研究这种星际2 Alpha Go的工具,并把研究成果开放给全世界的研究人员共同研究。

更值得我们读者注意的是,即使你不是科学家,而只是一个星际2玩家,不久之后也可以通过在游戏中来给暴雪提供反馈数据,协助星际2的Alpha Go学习提高。

在2017年第一季度,暴雪将想会在星际2中推出API工具包,通过玩家进行游戏的反馈来协助AI的脚本开发。

未来人类和无数“Alpha Go”一起参加星际2比赛不再是梦

没错,如果未来真的成功研发出星际2的Alpha Go,那么成为你的教练、甚至批量生产成为你在比赛中对手自然也不再是梦。也许未来的星际2比赛将不再是韩国选手与非韩选手的大战,而是人类与智能机械的大战。这点倒是很像《守望先锋》中描述的人类与智械大战。

AlphaGo要在星际2吊打人类?AI智能与人类在星际2上更多的互动未来不是梦

开个有趣的玩笑,如果未来真的有一天人工智能统治了星际争霸2,请不要忘了,这都源自今天的我们通过API工具包为它们的提高提供了帮助...

(注:DeepMind目前并未命名未来星际2的智能AI名字,因此本文所提到的“星际2 Alpha Go”旨在助于读者理解)