目前,业内存在共识:下一个AI里程碑可能会在复杂策略游戏中诞生。
这种说法并非空穴来风,现今AI研究最大的难题就是多智能体强化学习。在同一环境的多个智能体,如何既能互相竞争提高个人效率,又能互相配合提高团队收益,这一议题备受高校和企业关注。与此同时,AI界还面临着算法、数据、算力、场景四大因素的制约,缺少任何一环,都无法建立出优秀模型。
由腾讯 AI Lab、王者荣耀、腾讯高校合作、腾讯游戏学院等共同发起,由腾讯云计算提供底层资源支持的“腾讯开悟多智能体强化学习大赛”便是破局的尝试。“开悟”平台期望通过加强与高校科研的联动,促进“AI+游戏”的探索研究,这将是攻克通用人工智能难题的关键一步。
《王者荣耀》提供了高度复杂的游戏环境,参赛队伍在优化模型时,不仅需要考虑AI英雄的单兵发育,还得训练提高它们的团队意识,这与多智能体强化学习的命题不谋而合。其次,拥有“开悟”平台提供的算力、模型、评估等方面的支持,参赛者能更好地甄别算法效率上的优劣,提出改良方案。
正如者荣耀执行制作人、腾讯天美L1总经理黄蓝枭介绍的那样:“我们将自己在做多智能体研究的过程中所沉淀的技术资产开放出来,建设了‘开悟’开放平台,打造利用‘王者’的核心技术构建的,对使用者低成本的多智能体人工智能算法研究、教学和验证的科研教学平台。我们开放了《王者荣耀》的核心机制,提供标准接口、脱敏的测试数据、评估工具和计算集群等,给老师和同学们进行多智能体的机器学习算法研究、学习成果交流、对算法成果反复迭代升级。”
兴许下个AI的里程碑会在《王者荣耀》中出现,“开悟”大赛的各位参赛者,加油!