一、大数据分析与挖掘
大数据的基本概念
比较有代表性:
1) 3V 定义,即认为大数据需满足 3 个特点:规模性
(Volume) 、多样性 (Variety) 和高速性
(Velocity) 。
2) 4V 定义,即尝试在 3V 的基础上增加一个新的特性。
关于第四个 V 的说法并不统一, IDC 认为大数据还应当
具有价值性 (Value) ,大数据的价值往往呈现出稀疏性
的特点。而 IBM 认为大数据必然具有真实性
(Veracity) 。
3) 维基百科对大数据的定义则简单明了:大数据是指利
用常用软件工具捕获、管理和处理数据所耗时间超过可容
忍时间的数据集。