我院由数据科学与工程团队独立完成的论文被CCF A类国际人工智能学术会议IJCAI 2023接收

       近期,我院数据科学与工程团队独立完成的论文被中国计算机学会(CCF)推荐的A类国际人工智能学术会议International Joint Conferences on Artificial Intelligence(简称IJCAI)2023接收,并将于2023年 8月21日在专题会上进行相关成果汇报。IJCAI 2023整体录用率约为15%。

 

TDG4Crowd:Test Data Generation for Evaluation of Aggregation Algorithms in Crowdsourcing

 

TDG4Crowd:众包环境中的汇聚算法评价自动数据生成框架

方毅立,沈超杰,古华茂,韩焘,丁鑫怡

浙江工商大学

 

图片

 

      在众包场景下,汇聚算法被用于从众多工人的标注中推断出真值。但是如何评估这些汇聚算法的好坏成了众包系统设计的一个重要问题当前的评价方法主要有理论分析和数据集检测。但是由于真实环境的复杂性,理论分析在实践中往往在受限的成本中获得大量的真实的测试集成为评估结果汇聚方法的重要问题同时由于数据集自身的缺陷,不同的汇聚算法在不同数据集上表现出了不一致性导致出现不平衡问题针对该问题,本文首次提出了一种基于少量种子数据自动生成测试用例的框架。实验表明,使用我们的框架生成的数据更接近真实数据集。不同汇聚算法在使用我们方法合成的数据集上表现也更加一致。

 

 

数据科学与工程团队简介

 

数据科学与工程团队现有成员9人,有包括国家长江学者讲席教授、浙江省千人计划特聘专家及浙江省“151人”等省部级以上人才多人次。团队承担过国家自然科学基金省部级重点重大、省自然基金等多个课题。团队主要围绕复杂大数据可计算、群体智能可学习、多态跨域知识可关联等科学问题, 创建以数据建模、群体智能、知识图谱及大图计算为重点的大数据科学理论体系, 研究面向数字经济和电子商务产业中的商业、金融、社交等领域大数据的统计与深度学习、多示例与多标记学习、代价敏感与类别不平衡学习、联邦与强化学习等方法,研发用户行为分析、领域知识图谱构建、人机融合的群智计算、异构数据流挖掘及社交网络大图计算等大数据存储及处理技术, 解决网络空间大数据的感知、存储、分析及预测等问题。在IJCAI、ICDE、IJCAI、TKDE等CCF A类会议/期刊发表论文多篇