img

【大数据】常用技术指南(第三期)不定期更新

随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。 大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。 Github: https://github.com/huangyueranbbc

共13个

Spark机器学习 完整中文版,高清带书签目录(彭特里思著)
Spark最全操作完整示例代码
MAHOUT实战2017最新中文版
spark最新集群搭建指南2017
Spark 2017最新运行命令样例
spark学习笔记
基于mapreduce的pagerank实现DEMO下载地址
基于ItemCF协同过滤、hadoop-mapreduce的商品推荐系统下载地址
基于spark的50万亚马逊美食评论分类系统下载地址(决策树 逻辑回归)
Flume最新版自定义开发入门案例下载地址 Java
Storm JAVA版上手demo下载地址
kafkaDEMO源码下载地址
DruidIODemo源码下载地址