我院肖衡副教授进行“基于AIGC的可控图像生成”学术讲座

发布者：系统管理员发布时间：2024-01-08浏览次数：764

2024年1月5日，信息与智能工程学院肖衡老师在书新四号楼会议室开展一场关于AIGC技术实现可控图像生成的学术讲座。

肖老师从AIGC的定义、发展、应用及主流模型四个方面进行阐述。在应用方面通过例举各大平台AI技术的应用案例，如智能视频剪辑、AI绘画、AI写作、数字人等，来展示生成式人工智能涉及到的生成方式、生成内容、生成流程等。从收集数据，到模型训练，再到调用模型、评估优化，详细地介绍了生成式人工智能的运行流程。

围绕AIGC的主流模型，肖老师重点介绍了基于生成对抗网络与扩散模型两个方向。Diffusion模型是基于概率分布的生成模型，其基本原理是通过迭代式的扩散过程，逐步将输入图像中的信息模糊化，从而实现对图像的生成和控制。该模型的核心算法是通过不断应用概率分布函数来更新图像，使得图像的信息逐渐传播和混合，从而生成出具有艺术性和独特风格的图像。肖老师通过墨水滴入水中扩散溶解的过程，类比介绍Diffusion扩散模型的基本原理，使得抽象内容变得通俗易懂。

此外，肖老师还向大家展示了她基于生成对抗网络模型设计出来的数字人，通过输入一段语音、视频，可以将输入的语音转为相应的唇部动作，再替换视频中的唇部，实现人物的口型与语音一致，并使用超分增强算法，实现高清数字人的生成。

最后，肖衡表示还将继续研究不同方式实现数字设计，优化模型，并邀请感兴趣的同学一起参与进来，共同学习，开启智能创作的新里程。