中国科学院软件研究所 中国科学院北京分院
重点研究领域:以多个国家重点实验室、国家工程研究中心为龙头的基础前沿研究、软件高技术研究和软件应用研究三大科研体系,建立了计算机科学、计算机软件、计算机应用技术等重点学科领域和相关学科方向的学科布局。
所在地:北京市,北京
机构简介:

中国科学院软件研究所成立于1985年3月1日,是一所致力于计算机科学理论和软件高新技术的研究与发展的综合性基地型研究所。所址位于北京海淀区中关村南四街4号中国科学院软件园内。   从五位筹建者,到现在的千余名师生员工;从借用房间做研究,到如今拥有三栋科研楼和无锡、重庆、哈尔滨、广州、青岛、贵阳六处研究所分部研发基地;从最初44万元年度经费,到现在每年超过2亿元的年度经费;从仅有两台16位微型计算机,到如今形成了以多个国家重点实验室、国家工程研究中心为龙头的基础前沿研究、软件高技术研究和软件应用研究三大科研体系,建立了计算机科学、计算机软件、计算机应用技术等重点学科领域和相关学科方向的学科布局。软件所人秉承“创新求实,永竞一流”的精神,栉风沐雨、披荆斩棘,不断迈上新台阶。   软件所设有软件基础研究部、软件高技术研究部、软件应用研究部和软件发展研究部等四个研究部以及总体部,集中了一批学术造诣深厚、享誉国内外的科学家,拥有一支高素质、高水平的青年科技人才队伍。研究所现有正式职工576人,其中中国科学院院士3名,第三世界科学院院士1名,研究员及正高级工程师66名,副研究员及高级工程师103名。国家杰出青年基金获得者2人,国家优秀青年基金获得者1人,中科院百人计划入选者7人。全所在职职工平均年龄36岁。   软件所现有计算机科学与技术、软件工程两个一级学科硕士、博士研究生培养点,计算机技术、软件工程两个全日制专业学位硕士研究生培养点;并设有计算机科学与技术、软件工程两个博士后科研工作流动站;同时,软件所还是首批开展招生培养电子与信息领域工程博士的试点单位之一。现有在学研究生460人,其中硕士生263人,博士生197人;在站博士后13人。   软件所积极参与院地、国际交流与合作,与国内许多省市,国际上美、欧、日、澳等40多个国家和地区建立了广泛的科技交流与合作,成立了无锡分部、重庆分部、哈尔滨分部、广州分部、青岛分部和贵阳分部。   中国中文信息学会、中国软件行业协会数学软件分会、中国密码学会密码算法专业委员会等挂靠在研究所。研究所主办的学术刊物有《软件学报》、《中文信息学报》、《计算机系统应用》和《International Journal of Software and Informatics》。   建所近三十年来,特别是进入中国科学院知识创新试点工程以来,软件所在计算机科学和软件领域取得了丰硕成果,获院、省部级以上成果奖38项(全部为第一完成单位),其中包括国家自然科学奖一等奖1项、二等奖2项、三等奖1项;国家科技进步奖二等奖8项、三等奖2项。尤为值得一提的是,计算机领域第1个国家自然科学一等奖出自软件所。

展开 收起
科研成果
电子信息技术

脑部网络可视分析

脑成像数据可视化(MRI、DTI等)是科学、医学大数据可视化领域的热点研究课题。已有研究大多集中于微观脑部结构可视化,如神经元、体素(voxel)层面的连接图。这些微观结构上的连接特征在人群之间不具有典型且稳定的差异(Bio-marker),难以用于疾病防控等宏观领域。课题组与美国著名脑成像研究所合作,基于阿尔默茨病数据集,系统地比较了多种经典网络可视化在真实宏观脑部网络上的可视分析效果。针对阿尔默茨病分析等典型应用任务,课题组创新性的总结了脑部网络区块间连接比较分析任务,并基于该任务引入了混杂矩阵与节点边设计的网络可视化原型。经过用例调研和用户实验,全面验证了这一新型宏观脑部网络可视化方法的有效性。研究成果被国际顶级可视化会议IEEE VIS-2016接收,并推荐到TVCG期刊发表。这也是IEEE VIS会议首次收录基于真实数据的宏观脑部网络可视化论文。脑部网络的结构分析对于脑神经科学、认知科学等有着重要的意义。目前的脑部网络结构分析,主要基于离线数据挖掘分析或在线交互式可视化工具进行探索,但尚未结合数据分析与交互人机界面两者的优势。我们借鉴新兴的可视分析理论与方法,提出一套脑部网络可视分析框架并实现了原型系统,该系统面向多标签脑部网络数据分类浏览与可视比较任务,主要创新点在于:(1) 在可视化系统中引入多种稀疏回归模型,允许用户根据组间比较效果选择的脑部网络特征展示;(2) 通过可视分析手段交互浏览多标签脑部网络数据集。该系统原型已部署于著名脑神经疾病阿尔茨海默病数据集,并在脑神经内科医生的实际案例调研中得到验证。该工作相关论文已被ACM TKDD 全文接收。

电子信息技术

互联网用户异常行为分析与挖掘

针对Twitter、微博等公开社交媒体中的用户发文数据,创新性地提出了主题序列模式的概念,通过建立同一用户发文内容之间的关联关系,准确刻画了互联网用户完整而重复的发文行为,体现了发文背后的真实意图和潜在意图。在此基础上,提出了用户感知的稀有主题序列模式的挖掘问题,并设计了高效的挖掘方法,利用“整体稀有,局部频繁”的特征,在海量的数据中挖掘出这些个性化和异常的行为模式,并找出对应的异常用户。实验结果表明,我们的方法能有效地发现互联网中具有特殊行为的用户,而且对应的主题序列模式可以很好地解释他们的个性化特征、特定任务和发文意图。比如,具有模式<健康,产品,购买> 的用户可推断为化妆品推销员。另外,在对特定领域(比如体育领域)的帖子进行分析时,我们的方法可以区分处于不同角色的用户,并找出每种角色中的典型用户。此工作发表在TKDE期刊中,得到了国际同行的高度评价:“此工作具有很强的理论和应用价值,开创了互联网挖掘领域一个新的研究方向”。目前,我们已经公开了数据集,已有多家研究机构的研究人员与我们进行交流,正在此工作基础上开展进一步的研究。同时,我们将此方法应用于经济案件的侦破中,发现了更多的嫌疑人和嫌疑团伙。