2024年1月5日,信息与智能工程学院肖衡老师在书新四号楼会议室开展一场关于AIGC技术实现可控图像生成的学术讲座。
肖老师从AIGC的定义、发展、应用及主流模型四个方面进行阐述。在应用方面通过例举各大平台AI技术的应用案例,如智能视频剪辑、AI绘画、AI写作、数字人等,来展示生成式人工智能涉及到的生成方式、生成内容、生成流程等。从收集数据,到模型训练,再到调用模型、评估优化,详细地介绍了生成式人工智能的运行流程。
围绕AIGC的主流模型,肖老师重点介绍了基于生成对抗网络与扩散模型两个方向。Diffusion模型是基于概率分布的生成模型,其基本原理是通过迭代式的扩散过程,逐步将输入图像中的信息模糊化,从而实现对图像的生成和控制。该模型的核心算法是通过不断应用概率分布函数来更新图像,使得图像的信息逐渐传播和混合,从而生成出具有艺术性和独特风格的图像。肖老师通过墨水滴入水中扩散溶解的过程,类比介绍Diffusion扩散模型的基本原理,使得抽象内容变得通俗易懂。
此外,肖老师还向大家展示了她基于生成对抗网络模型设计出来的数字人,通过输入一段语音、视频,可以将输入的语音转为相应的唇部动作,再替换视频中的唇部,实现人物的口型与语音一致,并使用超分增强算法,实现高清数字人的生成。
最后,肖衡表示还将继续研究不同方式实现数字设计,优化模型,并邀请感兴趣的同学一起参与进来,共同学习,开启智能创作的新里程。