决策智能是国家新一代人工智能的重要发展方向,也是实现国家创新发展战略的重要基石。在决策智能的探索道路上,人机对抗已成为国际公认的重要途径之一。由中科院自动化所智能系统与工程研究中心发布的人机对抗智能门户网站致力于汇聚人机对抗平台环境,共享人机对抗技术成果,发布人机对抗领域最新消息,从而推动人机对抗智能技术生态建设与发展。
日前,人机对抗AI训练场已完成功能更新。根据近期开发用户的反馈,本文特提供训练平台以及分布式兵棋AI算法开发的使用教程。通过本教程,研发人员可以快速掌握分布式学习型兵棋智能体开发及训练技巧,从而自主实现更高水平兵棋智能体研发。
本次教程主要分为人机对抗AI训练场视频教程与分布式AI算法开发文字教程。
一、关于人机对抗AI训练场的使用
基本使用视频教程内容涵盖了从项目创建到获得相应智能体,以及智能体进行进阶调试与训练的完整流程。具体操作包括项目创建,Fork项目,在线训练,一键评估,查看上传排行榜等常用功能。您可以观看以下视频了解如何通过五步操作,完成智能体训练目标:
二、关于分布式AI开发
关于基准AI的开发需要一定的代码基础,教程内容具有一定的挑战性。完成教程学习后,您将了解如何依托“庙算·智胜”即时策略兵棋人机对抗平台提供的对抗环境和想定(5V5想定(2010431153)),实现一个基于impala的分布式兵棋强化学习AI。
教程主要内容包含impala算法与ray框架,代码架构梳理,代码执行与重要参数说明,强化学习要素,网络设计与决策,控制模块,强化学习训练等内容。
详情请见图灵网论坛:http://turingai.ia.ac.cn/threads/detail/464
本次教程由康雅萱,姚蒙提供。欢迎大家试用人机对抗AI训练场,诚邀各位专家挑战人机对抗AI训练场在线训练的智能体排行榜并在论坛进行更多的交流。人机对抗AI训练场申请试用地址:
http://turingai.ia.ac.cn/training_center
全新界面,更多功能,更优体验,人机对抗AI训练场新版本来啦!本次更新新增了代码在线编辑、智能体在线评估、标准想定与分布式强化学习训练等功能,优化了用户体验。在AI训练场新版本中,您可以在线进行源码编辑→分布式训练→推演评估等操作,实现兵棋与德州扑克智能体从0到1的全流程开发、训练与评估。
汇聚人机对抗平台测评环境、共享人机对抗最新技术成果。
走向通用人工智能前路漫漫,让我们共同努力,共同推动智能技术的变革与突破!