img
share 分享

Hadoop大数据实战权威指南(第2版)

作者:黄东军

出版社:电子工业出版社

ISBN:9787121370335

VIP会员免费 (仅需0.8元/天) ¥ 55.3

温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!

电子书推荐

更多资源 展开

大数据-互联网大规模数据挖掘与分布式处理.part1 评分:

第 1 章 数据挖掘基本概念 ............................... 1 1.1 数据挖掘的定义 ........................................... 1 1.1.1 统计建模 .......................................... 1 1.1.2 机器学习 .......................................... 1 1.1.3 建模的计算方法 ............................... 2 1.1.4 数据汇总 .......................................... 2 1.1.5 特征抽取 .......................................... 3 1.2 数据挖掘的统计限制 ................................... 4 1.2.1 整体情报预警 ................................... 4 1.2.2 邦弗朗尼原理 ................................... 4 1.2.3 邦弗朗尼原理的一个例子 ............... 5 1.2.4 习题 .................................................. 6 1.3 相关知识 ...................................................... 6 1.3.1 词语在文档中的重要性 ................... 6 1.3.2 哈希函数 .......................................... 7 1.3.3 索引 .................................................. 8 1.3.4 二级存储器 .................................... 10 1.3.5 自然对数的底 e .............................. 10 1.3.6 幂定律 ............................................ 11 1.3.7 习题 ................................................ 12 1.4 本书概要 .................................................... 13 1.5 小结 ............................................................ 14 1.6 参考文献 .................................................... 14 第 2 章 大规模文件系统及 Map- Reduce ................................................. 16 2.1 分布式文件系统 ......................................... 16 2.1.1 计算节点的物理结构 ..................... 17 2.1.2 大规模文件系统的结构 ................. 18 2.2 Map-Reduce ................................................ 18 2.2.1 Map任务 ........................................ 19

...展开详情
上传时间:2017-09 大小:59.5MB
热门图书