为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊

  • 我要分享:

  中新网客户端北京7月15日电(记者 宋宇晟)“整体的感觉就是AI太猛了,它们总是能做出异于常人的反应……”

  在1:3输给人工智能后,有王者荣耀电竞职业选手这样说到自己对战时的感受。

  此后更有网友在社交媒体直言,“人类连玩游戏也打不过AI了”“人类再次一败涂地”……

  那么,让人工智能去玩《王者荣耀》就是为了“虐菜”吗?中新网记者最近和该AI模型负责人聊了聊。

比赛现场。受访者供图

比赛现场。受访者供图

  3:1 “属于正常发挥”

  几天前,在世界人工智能大会现场,一款名为“绝悟”的游戏AI与五位来自王者荣耀职业联赛的选手现场进行了一场表演赛。

  有报道指出,人工智能在比赛中相继打出了“蹲草”“前后拉扯输出”“辅助开团”等操作,并在团队合作上颇具专业意识。

  在这场五局三胜的赛事中,人工智能以3:1的比分战胜了五位职业选手。

  尽管胜负成绩成了关注这场比赛的网友讨论的热点话题,但王者绝悟AI模型负责人邱福浩却告诉记者,团队对比赛的胜负没有预期。

  作为研发人员,他们更希望人工智能可以把握与高水平玩家切磋的机会,验证能力并不断成长,虽然这样的成绩“属于正常发挥”。

比赛现场。受访者供图

比赛现场。受访者供图

  此外,很多网友猜测,相较于人类职业选手的反应速度,人工智能或许在操作方面有着“绝对优势”。

  然而,邱福浩却向记者明确表示,在数值和操作上,王者绝悟AI并没有独特的优势,在游戏中的客观条件限制是一致的。

  “在英雄的自身状态参数上,AI并没有额外的加成,与人类玩家相同;AI在视野观测上与人类玩家保持一致,对于战争迷雾中的不可见单位,AI同样也看不到;AI的操作反应也做了客观限制,其反应分布和均值与KPL职业选手是相接近的。根据实际观察,人类玩露娜等英雄会比AI更秀。”

比赛现场。受访者供图

比赛现场。受访者供图

  AI一天对局数≈人类440年

  既然客观条件没有什么不同,人工智能为何能战胜人类职业选手?

  邱福浩给出的答案是训练量。“AI的优势在于其庞大的训练量,一天对局数约等于人类440年。”

  用研发团队的话说,自2017年启动项目,王者绝悟AI从模仿人类的监督学习,到自我博弈的强化学习,经过了多次迭代,攻克了多个难题,才逐步进化成了全英雄职业电竞水平的“完全体”。

  邱福浩介绍,2018年,王者绝悟AI还只是顶尖业余玩家的水平;到了2019年,王者绝悟AI不再需要模仿人类数据,而是通过自己和自己对战,进一步提升微操水平和大局观,已达到了王者荣耀职业电竞水平;去年,它学会了更多英雄玩法,并用40个英雄首次接受玩家们的挑战;最新版本中,团队又在竞技比赛的局前和局内阶段,进行了针对性优化。

资料图:2016年的围棋人机大战。

资料图:2016年的围棋人机大战。

  几年前,AlphaGO击败人类职业围棋选手时,一度震惊世界。

  与围棋相比,《王者荣耀》是一个不完全信息博弈场景,需要多个AI协作完成任务,且需在复杂连续的决策空间下进行长期决策。

  换句话说,教会人工智能玩《王者荣耀》,比让人工智能下围棋更难。

  邱福浩说,围棋的动作空间多达10的172次方,而AI在王者荣耀一局游戏中的操作可能性则多达10的20000次方。

比赛现场。受访者供图

比赛现场。受访者供图

  让AI打游戏不是终点

  但,进行如此复杂的研发、训练,就只是为了让人工智能在游戏中打败人类吗?

  邱福浩并不这么看。因为人工智能最终是要服务于人类的。