2026年5月26日16:00在书新4号楼西303,信息与智能工程学院开展“基于图神经网络的人工自然语言语义挖掘仿真”专题讲座。讲座由学院周显春教授主讲,围绕人工自然语言、语义挖掘、图神经网络、半监督学习和聚类优化等内容展开,引导学生理解人工智能文本理解技术的基本思路与应用价值。
讲座中,周显春老师首先介绍了语义挖掘的基本概念。他指出,人工自然语言是网络环境下可被计算机处理的自然语言文本数据,语义挖掘则是从非结构化文本中准确提取有用信息的过程。语义信息是文本中最核心、最有价值的部分,是计算机从关键词匹配走向理解人类意图的重要基础。

随后,周显春老师分析了语义挖掘面临的主要挑战。当前网络文本具有半结构化、多尺度、海量规模和复杂关联等特点,特征空间维度高,计算与存储压力大;同时,大量节点缺乏明确标签,传统监督学习难以有效实施,传统方法在聚类纯度和准确率方面也存在一定瓶颈。

针对上述问题,讲座重点介绍了基于图神经网络的语义挖掘框架。该方法通过图嵌入将网络节点映射至低维向量空间,并采用双重编码策略,融合文本语义信息与网络结构信息。其中,多头注意力机制用于增强文本编码,图卷积神经网络用于聚合邻居节点特征,使模型既能“读懂内容”,又能“看清关系”。
在标签稀缺问题上,周老师介绍了半监督降维思想,即利用少量已知标签约束大量未知节点的低维表征,从未标注数据中挖掘潜在语义模式,为后续聚类任务提供高效输入。在聚类优化方面,讲座介绍了改进FCM模糊聚类、数据约减和免疫单亲遗传算法,以提升大数据量场景下的计算效率和全局寻优能力。

实验验证环节显示,该方法在Pweb API服务真实数据集上取得较好效果,数据涵盖Medical、Video、Email等领域,聚类纯度、准确率和召回率均高于95%,并优于融合BERT和自编码网络的文本挖掘方法。
讲座最后,周老师指出,基于图神经网络与半监督学习的语义挖掘体系,可有效应对高维、海量和标签匮乏等问题,未来可应用于跨媒体检索、网络安全监控和智能客服等领域。他鼓励同学们夯实算法与数据结构基础,关注模型、数据与场景融合,不断提升智能技术应用能力。
一审一校 | 周显春
二审二校 | 杨涛
三审三校 | 李成名 尹娜



