信息技术的快速发展,特别是信息获取技术、信息物理系统、互联网、物联网、社交网络等突飞猛进,引发了数据规模的爆炸式增长。能源、制造业、交通运输业、服务业、科教文化、医疗卫生等领域都积累了TB级、PB级乃至EB级的大数据。这些大数据已经开始造福于人类,成为信息社会的重要财富。大数据蕴含着巨大的价值,对社会、经济、科学研究等各个方面都具有重要的战略意义,为人们更深入地感知、认识和预测物理世界提供了前所未有的丰富信息。由于大数据的迅速涌现及其蕴藏的巨大价值,已引起国内外学术界、工业界和政府部门的广泛关注。
伴随数据的爆炸式增长,数据质量问题也随之而来,劣质数据的存在,极大地降低了数据可用性。事实表明,大数据在可用性方面存在严重问题(以下简称数据可用性问题)。国外权威机构的统计表明,美国企业信息系统中1%~30%的数据存在各种错误和误差,美国医疗信息系统中13.6%~81%的关键数据不完整或陈旧。国际著名科技咨询机构Gartner的调查显示,全球财富1000强企业中超过25%的企业信息系统中的数据不正确或不准确。可以预见,随着大数据应用的不断扩大,数据可用性问题将日趋严重,也必将导致源于数据的知识和决策的严重错误。
大数据可用性已经成为国内外学术界、产业界和用户普遍关注的热点问题,在国内外掀起了一个空前的研究热潮。专刊选题为“大数据可用性理论、方法和技术”,将突出目前大数据可用性研究中的热点技术,如大数据可用性基础理论、数据获取过程中的可用性问题、错误自动检测与修复、弱可用数据(指不完整数据、不一致数据、不精确数据、时效性错误数据等)上的知识发现与近似计算,不确定知识的演化与管理等等。
本专刊将收录国内外大数据可用性研究领域中具有创新性和突破性的高水平研究成果,深入探讨其理论、方法与技术。专刊将于2016年第**期出版,读者群体包括数据库、数据挖掘、机器学习、体系结构、统计学等多领域的研究人员和工程人员等。
专刊题目:大数据可用性理论、方法和技术
特约编辑:李建中(哈尔滨工业大学) 、杜小勇(中国人民大学)
出版时间:2016年第7期
一、征文范围
本专刊的内容包括但不限于:
1) 大数据质量问题的基础理论
2) 高质量大数据采集和预处理的算法与技术
3) 量质融合的大数据存储管理模型、技术与系统
4) 大数据中不完整、不精确、不一致等错误的自动发现与修复
5) 大数据中实体识别算法与技术
6) 弱可用数据上的数据挖掘与知识发现
7) 弱可用数据上的近似计算理论与方法
8) 不确定知识库的基础理论
9) 不确定知识库的演化
10) 大数据量质融合管理系统平台与原型该系统
二、投稿要求
1. 投稿方式:采用"软件学报在线投稿系统"(http://www.jos.org.cn)投稿。投稿时稿件类型请选择“专刊投稿”,同时在中文标题后面加上括号,在括号内注明专刊名称,即:(大数据可用性理论、方法和技术)。
2. 稿件格式:参照《软件学报》论文格式(网站上提供了论文模版,可下载)。
3. 投稿文章未在正式出版物上发表过,也不在其他刊物或会议的审稿过程中,不存在一稿多投现象;保证投稿文章的合法性(无抄袭、剽窃、侵权等不良行为)。
4. 其他事项请参阅投稿指南 http://www.jos.org.cn/ch/reader/view_fixed_content.aspx?id=instructions
5. 投稿作者需提交投稿声明;专刊投稿文章不收审理费。录用刊发文章收取软件学报标准版面费。发表之后,将按软件学报标准支付稿酬,并赠送样刊。
三、重要时间
截稿时间:2015年9月25日
录用通知时间:2016年1月10日
提交修改稿时间:2016年1月20日
出版时间:2016年第7期
软件学报编辑部
2015年5月11日