是“捞”还是“挖”——大数据分析工具的抉择
大数据背后蕴含着大价值,这是众所周知的,但是关于如何挖掘数据价值则是众
说纷纭。纵观现行的数据挖掘方式和数据分析工具,主要采取的是“捞”和“挖”
两种方式。
我们先谈谈什么是“捞”数据。前些年的时候,网页上有一款叫“黄金矿工”
的小游戏异常火爆,相信很多人都不陌生。其实“黄金矿工”的游戏模式就比较
形象地诠释了“挖”捞数据的本质。我们把数据比作“黄金矿工”里的金子,你
控制的小矿工只要按照要求将铲子放下去就能顺利的勾住“金子”,从而收归囊
中,或者转化为其他利益。
“捞”数据就是直接利用原有的数据,一般不改变原有的数据。最多只对数据
做分拣、筛选和整合。比如一个区域经理想要做下个季度的销售指标,最直接有
效的参考就是本季度的销售数据。
相对于“捞”数据这种“捡现成”的数据挖掘方式,“挖”数据则显得复杂得
多。当然,很多时候挖掘的数据对象都是先“捞”过的。“挖”数据涉及到对数
据的“上钻”、“下钻”维度分析等等,通俗的来说就是数据联想和数据挖掘。著
名的“啤酒喝尿布”的故事从某种程度上来说也“挖”数据的成果。
或许你会觉得奶粉销量和汽车产量没有关系,或者是油轮石油泄露也不会影响