4月19日晚,学院与上海自主智能无人系统科学中心联合开展的智·信讲堂-抗“疫”特别系列讲座线上开讲。本次讲堂邀请到了学院雷金龙研究员作“不确定信息下的多智能体决策”主题报告,由学院副经理张皓教授主持。
雷金龙研究员分别从多智能体决策的背景、模型、势博弈的异步算法以及变尺度采样的分布式算法等方面展开报告。报告中,雷金龙研究员首先介绍了多智能体决策的背景和常见的决策优化模型及其对应的案例。介绍了纳什均衡的相关概念和基本假设及变分不等式问题与纳什均衡问题之间的等价关系。接着详细介绍了同步梯度响应、最佳响应算法、近似最佳响应算法,设计了针对随机变分不等式问题的求解算法。然后对于不确定信息下多智能体的纳什均衡问题,利用势博弈的方法提出异步近似最佳响应方案进行求解,在证明算法渐近收敛性的同时将算法拓展到加权势博弈情况。最后针对智能体仅能获取非完美局部反馈信息,介绍基于变尺度采样和采样梯度估计的分布式算法并给出仿真验证和性能分析。雷金龙研究员丰富精彩的报告为学校师生的学习和科研工作带去了思想启发,也为同学们学习多智能体决策优化与博弈提供了有益指导。
报告结束后,雷金龙研究员就多智能体决策中博弈论相关问题与师生们进行了交流。她也根据自身经历勉励同学们要积极拓宽视野,努力探索、发现并解决新的科学问题。此次报告进一步拓展了公司师生的科研视野,增强了同学们对多智能体决策优化与博弈方面的理解与认识。(文/图 张皓 王云姣)