电子信息技术

脑部网络可视分析

脑成像数据可视化(MRI、DTI等)是科学、医学大数据可视化领域的热点研究课题。已有研究大多集中于微观脑部结构可视化,如神经元、体素(voxel)层面的连接图。这些微观结构上的连接特征在人群之间不具有典型且稳定的差异(Bio-marker),难以用于疾病防控等宏观领域。课题组与美国著名脑成像研究所合作,基于阿尔默茨病数据集,系统地比较了多种经典网络可视化在真实宏观脑部网络上的可视分析效果。针对阿尔默茨病分析等典型应用任务,课题组创新性的总结了脑部网络区块间连接比较分析任务,并基于该任务引入了混杂矩阵与节点边设计的网络可视化原型。经过用例调研和用户实验,全面验证了这一新型宏观脑部网络可视化方法的有效性。研究成果被国际顶级可视化会议IEEE VIS-2016接收,并推荐到TVCG期刊发表。这也是IEEE VIS会议首次收录基于真实数据的宏观脑部网络可视化论文。脑部网络的结构分析对于脑神经科学、认知科学等有着重要的意义。目前的脑部网络结构分析,主要基于离线数据挖掘分析或在线交互式可视化工具进行探索,但尚未结合数据分析与交互人机界面两者的优势。我们借鉴新兴的可视分析理论与方法,提出一套脑部网络可视分析框架并实现了原型系统,该系统面向多标签脑部网络数据分类浏览与可视比较任务,主要创新点在于:(1) 在可视化系统中引入多种稀疏回归模型,允许用户根据组间比较效果选择的脑部网络特征展示;(2) 通过可视分析手段交互浏览多标签脑部网络数据集。该系统原型已部署于著名脑神经疾病阿尔茨海默病数据集,并在脑神经内科医生的实际案例调研中得到验证。该工作相关论文已被ACM TKDD 全文接收。

电子信息技术

互联网用户异常行为分析与挖掘

针对Twitter、微博等公开社交媒体中的用户发文数据,创新性地提出了主题序列模式的概念,通过建立同一用户发文内容之间的关联关系,准确刻画了互联网用户完整而重复的发文行为,体现了发文背后的真实意图和潜在意图。在此基础上,提出了用户感知的稀有主题序列模式的挖掘问题,并设计了高效的挖掘方法,利用“整体稀有,局部频繁”的特征,在海量的数据中挖掘出这些个性化和异常的行为模式,并找出对应的异常用户。实验结果表明,我们的方法能有效地发现互联网中具有特殊行为的用户,而且对应的主题序列模式可以很好地解释他们的个性化特征、特定任务和发文意图。比如,具有模式<健康,产品,购买> 的用户可推断为化妆品推销员。另外,在对特定领域(比如体育领域)的帖子进行分析时,我们的方法可以区分处于不同角色的用户,并找出每种角色中的典型用户。此工作发表在TKDE期刊中,得到了国际同行的高度评价:“此工作具有很强的理论和应用价值,开创了互联网挖掘领域一个新的研究方向”。目前,我们已经公开了数据集,已有多家研究机构的研究人员与我们进行交流,正在此工作基础上开展进一步的研究。同时,我们将此方法应用于经济案件的侦破中,发现了更多的嫌疑人和嫌疑团伙。