财联社3月15日讯(编辑 黄君芝)日前,谷歌DeepMind推出了SIMA(全称Scalable Instructable Multiworld Agent),顾名思义可扩展、可指导、多世界。
据悉,这是首个能在广泛3D虚拟环境和视频游戏中遵循自然语言指令的通用AI智能体,号称可以成为玩家拍档、帮忙干活打杂。不过,目前还处于研究阶段。
例如,它可以在《模拟山羊3》(Goat Simulator 3)中当司机开开车,在《幸福工厂》(Satisfactory)中挖矿石,在《瓦尔海姆》(Valheim)中寻找水源,在《无人深空》中(No Man’s Sky)驾驶宇宙飞船射击小行星收集资源。
参与该项目的谷歌DeepMind研究工程师Frederic Besse说道:“SIMA能够利用游戏中的共享概念,学习更好的技能,并学会更好地执行指令。”
在这之前,谷歌DeepMind也在AI+游戏方面也做过许多工作,比如推出能和人类玩家打PK、会玩《星际争霸II》的AlphaStar系统。而SIMA则被DeepMind称作是一个“新的里程碑”,主打从适用单一游戏转向通用多种游戏,且可遵循语言指令。
全新游戏方式
为了让SIMA接触到更多游戏环境,谷歌DeepMind团队与多家游戏工作室合作,收集了人类在3D环境下玩10种不同游戏的键盘和鼠标数据。
然后,来自人类玩家的数据被输入到为现代聊天机器人提供动力的语言模型中,该模型通过消化巨大的文本数据库获得了处理语言的能力。然后,SIMA就可以根据键入的命令执行操作。最后,人类评估了SIMA在不同游戏中的努力,生成用于微调其性能的数据。
经过所有这些训练后,SIMA能够响应人类玩家发出的数百个命令来执行操作,例如“向左转”或“前往宇宙飞船”或“穿过大门”或“砍倒一棵树”。
据悉,该程序可以执行600多种动作,从探索到战斗再到工具使用。此外,研究人员避免了具有暴力行为的游戏,这符合谷歌的人工智能道德准则。
“这在很大程度上仍然是一个研究项目,”谷歌DeepMind团队的另一位成员Tim Harley说:“然而,人们可以想象有一天,像SIMA这样的AI智能体会和你一起玩游戏,与你和你的朋友一起玩。”
此外,即使是在未经训练过的游戏中,SIMA的表现也能和专门使用该游戏数据集训练过的智能体表现一样好。也就是说,SIMA在全新环境中具备泛化能力。
这是一个很有希望的初步结果,但是SIMA需要进行更多的研究才能在已知和未知的游戏中达到人类水平。
研究人员表示,SIMA最终将学会如何玩任何电子游戏,甚至是没有线性结束路径的游戏和开放世界游戏。虽然它并不是要取代现有的游戏AI,但你可以把它看作是另一个与你的团队配合得很好的玩家。
“SIMA并不是为了赢得游戏而训练的,”谷歌DeepMind研究员、SIMA联合负责人Tim Harley 在一次记者招待会上说:“它接受过训练,可以运行它,并按照指令行事。”