2026年3月18日,一场题为《从感知到行动:Agent AI的多模态融合与具身智能之路》的科研专题讲座在书新4西303举行。本次讲座由学院教师杨婷婷教授主讲,吸引了虚拟专业2023级与2024级学子到场聆听。讲座围绕Agent AI(智能体人工智能)这一前沿领域,系统梳理了人工智能从被动任务处理向主动环境交互演进的范式变革。

讲座伊始,杨婷婷教授以《Agent AI: Surveying the Horizons of Multimodal Interaction》论文为理论引入,指出Agent AI作为一种能够感知视觉、语言、环境数据等多模态输入,并生成具身化行动的交互系统,正成为通向通用人工智能(AGI)的关键路径。她强调,这类系统不再局限于处理静态数据,而是能够在复杂环境中主动感知、决策与执行,标志着人机交互模式的根本性转变。

在核心内容讲解环节,杨教授从五大维度展开深度剖析。她首先解析了Agent AI的认知架构,阐明智能体如何整合感知、记忆、推理与执行模块;随后介绍了Agent Transformer与端到端学习为代表的训练范式,揭示了大模型时代下智能体能力跃升的技术原理。在跨领域应用部分,杨教授结合游戏智能体、机器人操控与医疗辅助诊断等典型场景,生动展示了Agent AI在现实任务中的落地潜力。

针对未来发展,杨教授进一步探讨了跨模态、跨领域与跨现实的技术融合路径,指出多模态对齐、环境泛化与现实世界交互是通往AGI必须攻克的核心难题。她认为,具身智能将成为下一代人工智能的重要突破口,推动机器从“理解世界”走向“改变世界”。
在结论与展望部分,杨婷婷教授勉励在场同学夯实多学科基础,关注智能体技术与行业需求的深度结合。讲座结束后,学生们围绕技术伦理、模型泛化能力等问题踊跃提问,现场学术氛围浓厚。此次讲座为虚拟专业学子系统理解Agent AI前沿方向提供了高质量的学习平台。
一审一校 | 杨婷婷
二审二校 | 刘小飞 闫吉府
三审三校 | 李成名 尹 娜



