新氦类脑智能 > 资讯洞察 > 活动信息 > 【10.27直播】新氦技术沙龙第21期——基于种群的多智能体强化学习:算法与系统 2021/10/13
【10.27直播】新氦技术沙龙第21期——基于种群的多智能体强化学习:算法与系统

活 动 背 景

Background


目前,多智能体深度强化学习在电子游戏等特定领域取得了突破性进展。其中最关键是基于课程学习不断调整适应智能体水平的新对手,以实现智能体稳定的水平提升。本期内容将介绍多智能体强化学习的背景,主流基于种群的多智能体强化学习,包括自对弈及结合博弈论或图论的算法。由于为了在系统层面支撑起深度强化学习研究与应用的训练系统越来越复杂,因此本期将进一步探讨:1)针对多智能体深度强化学习更复杂的训练、评估和采样需求;2)如何解耦数据流与任务流;3)在底层计算集群上提供更高层次的实现接口;4)为相关研究与应用在研发的门槛和效率上取得平衡。


微信图片_20211012151352.jpg