第一天
基础环境搭建
安装
安装
工具安装
感性认识大数据
、数据量很大
、数据产生很快,数据类型多种多样(图片,视频,音乐,文本)
、数据源非常广泛( 数据量有多少???)
数据肯定有价值才有分析的意义。
想想一下,猎人是如何根据动物的脚印捕猎的?
雪地上有很多动物你的脚印,然后猎人可以根据脚印来追踪猎物?
、雪地,存储媒介,存储数据资源(硬盘)
、信息资源,动物的脚印(数据)
问题:
、如果下雪脚印就消失了(数据丢失)
、雪地的脚印类型非常多(特定的数据才有价值,这个过程是需要数据清洗)
回到计算机世界:
、数据需要存储(加硬盘)
、数据不能丢失(保存副本)
、数据需要计算(????)
DIY 数据计算引擎
复习: