决策智能是国家新一代人工智能的重要发展方向,也是实现国家创新发展战略的重要基石。在决策智能的探索道路上,人机对抗已成为国际公认的重要途径之一。由中科院自动化所智能系统与工程研究中心发布的人机对抗智能门户网站(http://turingai.ia.ac.cn)致力于汇聚人机对抗平台环境,共享人机对抗技术成果,发布人机对抗领域最新消息,从而推动人机对抗智能技术生态建设与发展。
近日,人机对抗AI训练场新上线兵棋AI开发工具箱以及徳扑AI训练环境。
图1:人机对抗AI训练场功能简介以及开放路线图
训练场致力于帮助用户学习智能体的开发流程和技巧。训练场当前提供兵棋训练环境与德州扑克训练环境。
训练场提供给开发者训练与开发所需的资源,包括AI开发工具箱,基准AI实例与硬件资源。开发者可以直接Fork公开项目或者自定义配置参数创建项目,在项目创建成功后一键训练或下载,修改,追加源码实现自定义AI算法。训练结束后,可以通过日志查看训练后的效果或者下载模型前往对抗中心进一步评估性能。
图2:首页可以快速创建项目或者查看公开项目与我的项目
训练场本次更新的主要功能如下:
1. 训练场新增德扑训练环境并内置基准AI
目前训练场已经集成德州扑克训练环境,开发者可以在线使用德州扑克环境并学习训练内置的基准AI。
图3:首页可以快速创建项目或者查看公开项目与我的项目2. 训练场新增兵棋AI开发工具箱
AI开发工具箱是对兵棋环境的进一步封装,如奖励函数的设计,动作空间与特征空间的优化。除此之外,AI开发工具箱还内置多种常用的强化学习算法,方便开发者上手兵棋AI开发。开发者可以进一步通过学习基准AI,提高算法设计技巧。同时,训练场也提供自定义AI算法类型,该算法类型仅包含训练入口代码,开发者可以完全从零开始研发AI,从而为开发者提供不同层次足够灵活的AI开发与训练平台支撑。
图4:多种算法资源类型可供选择
目前我们采用申请-审核机制,审核通过后,每个用户拥有五天的试用时间。用户可通过智能门户网站训练中心(http://turingai.ia.ac.cn/training_center)点击申请使用。欢迎申请,改进提高。
汇聚人机对抗平台测评环境、共享人机对抗最新技术成果。
走向通用人工智能前路漫漫,让我们共同努力,共同推动智能技术的变革与突破!