人类全面溃败!AI训练4.5万年,DOTA 2人机大战大结局

  • 时间:
  • 浏览:1

图片来源图虫:已授站长之家使用

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权站长之家转载发布。

【新智元导读】OpenAI Five在Dota  2 中以2: 0 击败了世界冠军团队,人机大战人类最终不敌AI。OpenAI Five在去年输掉比赛后进行了优化,训练时间离米 人类玩了4. 5 万年。

OpenAI能不到不到认 当事人是世界第一了。

今天半夜三更三更,OpenAI Five在Dota  2 中以2: 0 击败了世界冠军团队OG,再次显示出了AI的强大威力,也正式否认 人类在Dota这个高难度游戏中成为AI的手下败将。

这次比赛,OpenAI Five的表现出是迄今为止展示出的最高水平:人类对手去年赢得了世界上最令人垂涎的电子竞技赛事TI8 的冠军;OpenAI Five在去年输掉比赛后进行了优化,训练时间离米 人类玩了4. 5 万年,赢得比赛也何必 出乎意料。

2:0,AI战胜人类

在这场人机大战中,每队不到 17 个英雄可供选者。 OpenAI还选者了所谓的“Captain's Draft”游戏模式。与以前的比赛一样,OpenAI也禁用了召唤和幻觉功能,这两项功能都涉及以英雄副本的形式引入这个变量,以及OpenAI训练系统时未考虑的这个特殊因素和单位。

除此之外,这场比赛与正常的Dota  2 比赛一样,其最终目标是摧毁敌方队伍的“基地”,即每个团队领土末端的大型塔楼,在敌人的队伍成功摧毁这个小型塔后,基地是很脆弱的,整个比赛过程的中心是对塔的攻防,以及英雄与英雄之间的团战。

在第一场比赛中,OpenAI Five让对手OG大吃一惊,通过一系列激进战术获得了胜利,其中包括对游戏中获取的金币的花费措施,在本方英雄死亡时立即买活,即使在比赛初期也是没人 。

对此,OpenAI首席技术官Greg Brockman指出,OpenAI喜欢促进短期收益的战略,说明在长期规划上不如人类,随后 DOTA2 这个游戏通常要依赖于长期规划后会 获胜。然而,在这场比赛中,这个早期的买活策略得到了回报,OpenAI Five获得了优势,当比赛拖入 200 分钟时,OG顶不住了。

在第二场比赛中,OpenAI表现更好,在最初的几分钟内即获得了对OG的早期优势,随后 无情碾压了人类玩家,在第一场比赛时间以前过半的时间点上即取得胜利。 

值得注意的是,OpenAI Five在第二场比赛中随后始于玩得异常激进,以及OG在AI全图范围内的推进时这个无力对抗。OpenAI Five后会 利用其特定的英雄选者带来的优势。

飞速进化的OpenAI Five:不可能 训练4. 5 万年

去年 8 月,OpenAI Five曾以3: 2 击败半职业人类玩家,不过当面对职业对手时,OpenAI便输给了paiN Gaming战队,帅不过三秒。

根据OpenAI联合创始人兼主席Greg Brockman(也是该组织的CTO)的说法,在输掉比赛以前,OpenAI Five是通过在加速的虚拟环境中进行自我改进而变得更加强大的。

OpenAI Five由深度1强化学习提供支持,也随后 说它的编码目的就有“怎样游戏”,随后 “怎样学习”。Brockman在比赛随后始于前表示。,AI在 10 个月中,不可能 玩了 420000 年的Dota  2 游戏,随后 ,玩了没人 长时间也没人 实在无聊。

这场比赛采用三局两胜制,所有bot都使用相同的深度1强化学习技术进行训练,并由同一OpenAI系统的不同层独立控制。

OpenAI向公众开放与AI对决,终极目标是实现通用人工智能

对于OpenAI来说,值得庆祝的不仅仅是这次胜利,还不可能 其证明了对强化学习的态度及其关于AI的普适哲学树立的里程碑。

研究团队将不再公开展示其AI 游戏bot,随后 致力于开发软件,我就类与OpenAI Five软件实时协作,与机器人一块儿玩游戏,并学习一帮人都 独特的前所未有的战略和行为。

OpenAI Five还发布了有4个 平台,供公众与OpenAI Five对战,这个模式称为“竞技场”模式,将于 4 月 18 日起开放五六天。OpenAI表示,协作软件不可能 永远不不向公众开放,不过一帮人都 能不到在活动中亲自尝试一下。

OpenAI的联合创始人兼首席执行官Sam Altman还表示,此类工作证明了与AI智能体的协作不可能 会在未来带来巨大的利益。

Altman说:“对于世界怎样运作,怎样训练哪些地方地方智能体,令实在现协作上,这次活动是重要的一课。实现人类与AI的协作,是一帮人都 对未来世界更积极的愿景之一,人工智能与人类一块儿努力,使人类变得更好、更有趣、更有影响力。”

OpenAI不可能 会继续涉足Dota  2 和这个视频游戏,主随后 不可能 哪些地方地方游戏是人工智能的良好测试平台,也是衡量AI技术进步的良好基准测试工具。

现在不可能 还没人 4个 多游戏像OpenAI Five从前,AI系统最终无法具备超出人类能力的水平。对于更广泛的AI行业而言,精通视频游戏不可能 减慢就会变得过时,一帮人都 不到简单的措施来证明AI系统能不到快速学习,后会 能减慢速高效地的避免现实世界的困难任务,获得更有意义的好处。

最终,OpenAI希望将其Dota  2 学习并扩展到游戏之外的新领域,并最终扩展到现实世界中。为此,OpenAI正致力于使用强化学习和这个技术,为机器人手提供更灵巧、更精细、更人性化的动作。

“OpenAI正在努力的方向建立通用人工智能(AGI),并与世界分享哪些地方地方好处,一块儿确保其安全性。”Altman说的是建立有4个 后会 执行任何人类任务的多功能AI系统。“一帮人都 的目标就有战胜电子游戏,实在这很有趣。一帮人都 的目标是揭开实现AGI道路上的秘密。”

参考链接:

https://www.theverge.com/2019/4/13/182009459/openai-five-dota-2-finals-ai-bot-competition-og-e-sports-the-international-champion