大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):
Volume(大量): 巨大的数据量
集中储存/集中计算已经无法处理巨大的数据量。
数据量呈指数增长:地震、录井 、石油钻塔的传感器一个月产生的数据量比全球所有的电影加在一起还要多。
新浪微博用户数2.5亿+,高峰每天几亿条。
Variety (多样):非结构化数据多样性
文本/图片/视频/文档等,如诸如微地震,电磁以及光纤分布式温度监测(DTS) 。
Velocity(高速):数据增长速度快
用户基数庞大/设备数量众多/实时海量/数据指数级别增长。
value(低价值密度):数据的价值性
每个钻井平台有 40,000 传感器,但是通常只有 10% 的数据使用到。
每个深水钻井平台的投资可达到$150M,能有效利用所有的数据非常关键,关系到安全与优化运营 。
Vercity(真实性):数据的真实性
想要查阅更多相关文章,请访问php中文网!!
免责声明:本站内容仅用于学习参考,信息和图片素材来源于互联网,如内容侵权与违规,请联系我们进行删除,我们将在三个工作日内处理。联系邮箱:chuangshanghai#qq.com(把#换成@)