近日,计算机学院数据科学与工程团队在数据库/数据挖掘/内容检索领域研究最新研究成果被数据库/数据挖掘/内容检索领域顶级期刊IEEE TKDE录用。研究成果:Discovering Cliques in Attribute Graphs Based on Proportional Fairness。该论文主要由李泳晔,孙仁杰,王潇杨,陈晨,张颖,张文杰等人共同完成。
社区发现作为图挖掘领域的核心任务之一,长期以来受到学术界和工业界的广泛关注,旨在揭示网络中连接紧密、边界稀疏的群体结构,在社交网络分析、电商推荐、舆情监测、生物信息等多个领域具有重要意义。随着现实网络中多源异构信息的涌现,传统仅基于拓扑结构的图模型已难以满足复杂场景需求。尤其是在属性图中,节点往往携带丰富的语义标签或社会属性,这为更精准、个性化的社区挖掘提供了新机遇。
然而,现有属性图社区发现模型普遍忽视“公平性”原则,这在数据驱动的自动化决策中可能导致结果偏向高频群体,造成少数属性群体被边缘化,进而引发社会不公问题。为解决这一挑战,本文提出一种新颖模型——比例公平团(Proportional Fair Clique,PFC),将图论中的clique结构与比例公平性约束相结合,在保证社区结构紧密性的同时,确保每类属性群体在社区中均有合理比例的代表,从而提升模型的包容性与公正性。
本文进一步证明,枚举所有极大比例公平团(MPFC)的问题为NP-Hard,并在经典Bron–Kerbosch框架基础上提出一套合理的基线算法。针对大规模图数据,本文设计了多项优化策略以提升计算效率。实验结果表明,所提模型在公平性和结构质量方面表现优异,优化策略在运行效率上相较基准模型实现了3–4个数量级的提升。

IEEE TKDE,英文全称IEEE Transactions on Knowledge and Data Engineering,这个期刊是中国计算机学会推荐国际学术会议和期刊列表的A类期刊,影响因子 8.9,在数据库/数据挖掘/内容检索领域具有极高的评价。