在几乎所有的游戏中,玩家都可以选择电脑,也就是AI作为自己的对手,比如以Dota、英雄联盟、星际争霸为代表的即时战略游戏,或者通过调整游戏终作中的难度来选择更“难”的AI。但是AI在游戏中长期扮演“新手”的角色,属于新玩家的陪练。比如十几年前的《红色警戒》,也许只有有1 vs 7的冷门电脑才能有挑战性。
另外,被高端玩家虐了之后,通过人机对战找到游戏体验的玩家可能不在少数。比如有一次和朋友玩《英雄联盟》,因为深夜同一组的五个同学连续被对手对着打,场面非常尴尬,尤其是几轮战斗都被对方压在地上的时候。所以,在我们的心态爆炸之前,我们决定玩电脑……所以我们紧张的心情得到了放松。
既然有些人热衷于人机,有些玩家自然会觉得和电脑对抗“太无聊”了...然而,随着AI的不断加强,如今的电脑不再是“任人宰割”。10月31日,据外媒报道,DeepMind关于AlphaStar的论文发表在最新一期《自然》杂志上,介绍了人工智能AlphaStar的最新研究进展。现在AlphaStar在Battle.net的排名已经超过了99.8%的玩家,国外媒体也给出了评论:“AlphaStar现在是实时策略游戏的一代宗师。”
2017年,DeepMind宣布为即时战略游戏《星际争霸II-AlphaStar》进行人工智能研究。过去两年,AlphaStar的战绩可圈可点:2018年12月,AlphaStar以5: 0的战绩击败了职业选手;2019年7月,AlphaStar登陆Battle.net,开始使用与人类玩家相同的地图在平台上作战。现在在神族、人族、虫族三大种族中已经达到大师级别。
DeepMind表示,AlphaStar已经被限制在与人类玩家相同的环境中,比如摄像头视角、每5秒22次的非重复操作频率,以及支持三种族匹配。此外,AlphaStar采用了全自动学习流程。
综上所述,这两年,被玩家打败的AI成了“大神”,大部分玩家和笔者一样,成了电脑打不过的新事物。这里肯定会有朋友想问:加强AI有什么意义?就算游戏玩得好,AI能做什么?
其实不仅仅是星际争霸2,在此之前,AI已经“破解”了围棋、象棋和德州扑克,人类玩家几乎不可能战胜面前的电脑。但是相比这些游戏,星际争霸II对AI来说也是一个新的挑战,因为星际争霸有着更复杂的游戏系统,有着上千种操作模式,而且双方都无法及时获取对手信息,这意味着它是一款“信息不完善”的游戏,很难预测对手行为。换句话说,星际争霸的复杂游戏系统是一个理想的虚拟环境,可以作为人工智能研究的“试验场”。值得一提的是,DeepMind研究星际争霸已经超过15年,可见这个项目的复杂性。
研究更有效的训练方法
随着数据量的快速增加和对数据的需求越来越大,AI训练成为一个难题。以图像识别为例,如果人们进行标注,就会效率低下、成本高昂、枯燥乏味。投入大量后,仍然难以满足AI的学习需求。毕竟AI可以24小时持续接收“新知识”。因此,更合理、更高效的训练模式可以让AI成长更快。
比如根据DeepMind发布的AlphaStar游戏视频,可以看到AlphaStar在不断学习和提高,针对不同的情况掌握新的“策略”和策略、技巧,这个增长速度还是相当惊人的。虽然这并不意味着AlphaStar的学习系统是完美的,但由于它的自动学习特性,它的很多行为是人类难以理解的,或者说是“没有意义的”。DeepMind已经认识到自我游戏的缺点,可能会导致AI失去提升的机会。因此,在最新发表的研究中,DeepMind引入了一种称为“联盟”的训练方法,将自我游戏扩展到一组代理。
DeepMind为训练模型中的“主代理”,也就是对手,提供了一系列的“压榨代理”。压榨代理人的任务是揭露主要代理人的问题,并通过培训加以改进。应用到AlphaStar的训练后,AlphaStar可以掌握更复杂的策略,甚至可以针对对手的部署调整攻击模式。通过对AlphaStar的研究,研究者找到了更适合的训练方法,也可以排除很多无效的学习方法。这对于人工智能模型在其他领域的应用也具有参考意义。
扩展到更多字段
游戏只是AI应用的一小部分,包括图像识别、语音识别、虚拟助手和自动驾驶...随着AI和终端设备性能的提升,AI在云和终端的应用场景更加丰富。因此,虽然AlphaStar是基于《星际争霸2》训练的“智能体”,但如上所述,它的复杂性可以作为现实世界中的模拟环境。DeepMind希望其实验室和AI研究人员在增强学习方面取得的进展在未来得到更广泛的应用。
该公司的研究成果在现实世界中最有可能的应用是机器人技术,它可以在虚拟仿真中正确训练AI如何执行机器人手部操作等现实世界的任务。有了训练基础,AI便可以控制物理机械臂,甚至有一天可以控制整个机器人。与此同时,DeepMind还在为自动驾驶汽车做深度学习研究,其学习和训练可能会越来越复杂,相应地会让自动驾驶技术越来越安全。
更有趣的游戏体验
除了这些,既然AlphaStar的《通往上帝之路》始于星际争霸,将玩家的自尊心碾压在地,AI的应用场景自然不能错过游戏。AI应用到游戏中,最需要理解的就是提升游戏体验!除了硬件优化,如果AI更聪明,不仅会给游戏增加一个具有挑战性的对手,还能丰富游戏玩法!比如很多玩家在挑战王者荣耀的超级人机时,就不会感到轻松。同时,对于一些游戏来说,更先进的AI算法可以让游戏中的“路人”更加合理,而不是一些枯燥的动态地图。
目前AlphaStar已经超过了99.8%的玩家,不知道能否通过训练和算法优化达到新的巅峰,可能会受到很多玩家和专业人士的关注。你期待这样吗?