2024年5月10日,三亚学院信息与智能工程学院(信智学院)成功举办了主题为“基于通信的多智能体深度强化学习研究”和“自动驾驶车辆的多智能体强化学习与社会行为优化的研究”的学术交流活动。
此次活动由陈荣敏和吴宏坤两位同学分别汇报,郭大波教授指导,旨在深入探讨人工智能领域的最新研究成果和前沿技术。
陈荣敏同学在其汇报中详细介绍了多智能体强化学习(MARL)的基础概念、算法分类,并特别强调了近期文献中提出的基于Transformer的电子邮件机制(TEM)框架。该框架在多智能体合作任务中显示出优越的性能,并且具备良好的可扩展性,为MARL领域提供了新的研究方向。
吴宏坤同学则聚焦于自动驾驶车辆的社会行为,探讨了如何利用博弈论和社会价值取向(SVO)来优化自动驾驶系统的社会关注策略。他分享了独立AV控制的社会关注策略优化(SAPO)方法,通过动态建模提高多智能体自动驾驶系统的安全性和效率,该方法在SMARTS平台上进行了有效性验证。
本次活动是信智学院电子信息专硕点研究生学术交流会系列活动的重要组成部分。学院结合中国新能源汽车市场的发展背景和吉利汽车的技术创新需求,为研究生提供了一个产教融合、科教融汇的学术交流平台。
目前,电子信息专业硕士已经设置了计算机技术、人工智能、大数据技术与工程、网络信息安全四个培养方向,以满足不同学生的学术需求和发展方向。通过此类活动,信智学院致力于营造良好的学术氛围,鼓励学生积极参与学术交流,不断提升学术研究水平,推动产学研深度融合,为新能源汽车产业及人工智能领域的发展培养更多创新人才。