2025年11月21日16:14,信息与智能工程学院郭大波教授在书新四号楼四楼会议室发布了其最新研究成果——《多智能体深度强化学习通信七维度综述》。该研究首次系统性地提出了“基于通信的多智能体深度强化学习”的“七维度”分析框架,为该领域从理论研究迈向复杂现实应用奠定了重要基础。
随着人工智能技术的快速发展,强化学习已成为机器学习领域的重要分支。在多智能体环境中,智能体之间的协作与通信尤为关键。郭大波教授指出,尽管多智能体深度强化学习在解决现实问题中展现出巨大潜力,但其在部分可观、环境非平稳等问题上仍面临挑战。为此,团队聚焦于“基于通信的多智能体深度强化学习”,系统梳理并提出了涵盖“通信时机、通信对象、通信来源、消息聚合、通信作用、通信学习、通信约束”的七维度分析框架。该综述不仅弥补了现有研究在通信维度分类上的不足,还首次系统性地探讨了消息聚合方式、通信时机选择、通信对象多样性等关键问题。并提出参考文献进行分享,让同学老师能够得到学习。
郭大波教授在报告中进一步展望了未来研究方向,提出“场景驱动的通信机制设计”“局限性的量化分析”“维度组合的系统化优化”以及“新兴技术的深度融合”四大核心方向。他强调,未来研究应结合大型预训练模型、可解释人工智能等前沿技术,推动通信机制在语义理解、容错性与可解释性方面的突破。此次研究成果的发布,标志着信智学院在多智能体强化学习通信机制研究方面迈出了坚实一步,为智能体协同决策在自动驾驶、智能制造、智慧城市等复杂场景中的落地提供了理论支撑与实践导。
一审一校 |蔡金颖
二审二校 |杨 涛
三审三校 |李成名 尹 娜



