决策智能是国家新一代人工智能的重要发展方向,也是实现国家创新发展战略的重要基石。在决策智能的探索道路上,人机对抗已成为国际公认的重要途径之一[1]。
开放背景:继星际争霸人机对抗突破之后,兵棋推演作为人机对抗的下一个挑战,将牵引智能决策技术新的发展[2]。兵棋推演的智能决策技术与挑战[3]一文指出了兵棋AI研发的挑战问题如算子异步协同、非对称环境决策等,为了促进学术界更好针对如上问题开展研究,人机对抗智能门户网站将持续发布兵棋AI学习环境,填补兵棋决策智能研究关键问题基准学习环境空白,满足研究人员对标准学习环境库的需求,推动兵棋推演AI的突破。
环境库介绍:依托人机对抗智能门户网站开放平台,学习环境库将持续发布兵棋关键问题对应的标准学习环境集,包括但不局限:部分可观测异步智能体协同、非对称环境智能体进化学习等。
图1 兵棋推演AI学习环境库
本期开放环境:本次发布的学习环境对应兵棋算子间高效协同与对抗问题,即如何实现不完美信息下异步算子之间的协作[4]。
环境地址见 http://turingai.ia.ac.cn/app/detail/30,
可参考图灵网技术讲堂第2期第2讲http://turingai.ia.ac.cn/bbs/detail/15/1/35。
图2 部分可观测异步智能体协作学习环境POAC
汇聚人机对抗平台测评环境、共享人机对抗最新技术成果。
走向通用人工智能前路漫漫,让我们共同努力,共同推动智能技术的变革与突破!
[1] 人机对抗智能技术,中国科学:信息科学,http://scis.scichina.com/cn/2020/N112019-00048.pdf.
[2] AI in Games: Techniques, Challenges and Opportunities,https://arxiv.org/abs/2111.07631.
[3] 兵棋推演的智能决策技术与挑战,自动化学报,http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210547.
[4] The Partially Observable Asynchronous Multi-Agent Cooperation Challenge, https://arxiv.org/abs/2112.03809.