scikit-learn机器学习:常用算法原理及编程实战
电子书推荐
-
大数据日知录 架构与算法 PDF 带书签目录 高清完整版 评分:
目录 第0 章 当谈论大数据时我们在谈什么 1 0.1 大数据是什么 2 0.2 大数据之翼:技术范型转换 4 0.3 大数据商业炼金术 6 0.4 “大数据”在路上 7 第1 章 数据分片与路由 9 1.1 抽象模型10 1.2 哈希分片(Hash Partition) 11 1.2.1 Round Robin11 1.2.2 虚拟桶(Virtual Buckets) 12 1.2.3 一致性哈希(Consistent Hashing) 13 1.3 范围分片(Range Partition) 18 参考文献19 第2 章 数据复制与一致性20 2.1 基本原则与设计理念21 2.1.1 原教旨CAP 主义21 2.1.2 CAP 重装上阵(CAP Reloaded)23 2.1.3 ACID 原则24 2.1.4 BASE 原则24 2.1.5 CAP/ACID/BASE 三者的关系25 2.1.6 幂等性(Idempotent)26 2.2 一致性模型分类26 2.2.1 强一致性27 2.2.2 最终一致性28 2.2.3 因果一致性28 2.2.4 “读你所写”一致性29 2.2.5 会话一致性29 2.2.6 单调读一致性30 2.2.7 单调写一致性30 2.3 副本更新策略30 2.3.1 同时更新30 2.3.2 主从式更新31 2.3.3 任意节点更新32 2.4 一致性协议32 2.4.1 两阶段提交协议(Two—Phrase Commit,2PC)33 2.4.2 向量时钟(Vector Clock) 38 2.4.3 RWN 协议40 2.4.4 Paxos 协议42 2.4.5 Raft 协议45 参考文献49 第3 章 大数据常用的算法与数据结构51 3.1 布隆过滤器(Bloom Filter) 51 3.1.1 基本原理52 3.1.2 误判率及相关计算52 3.1.3 改进:计数Bloom Filter53 3.1.4 应用54 3.2 SkipList55 3.3 LSM 树58 3.4 Merkle 哈希树(Merkle Hash Tree) 62 3.4.1 Merkle 树基本原理62 3.4.2 Dynamo 中的应用63 3.4.3 比特币中的应用63 3.5 Snappy 与LZSS 算法65 3.5.1 LZSS 算法65 3.5.2 Snappy67 3.6 Cuckoo 哈希(Cuckoo Hashing) 67 3.6.1 基本原理68 3.6.2 应用:SILT 存储系统68 参考文献70 第4 章 集群资源管理与调度71 4.1 资源管理抽象模型72 4.1.1 概念模型72 4.1.2 通用架构73 4.2 调度系统设计的基本问题74 4.2.1 资源异质性与工作负载异质性74 4.2.2 数据局部性(Data Locality) 75 4.2.3 抢占式调度与非抢占式调度75 4.2.4 资源分配粒度(Allocation Granularity) 76 4.2.5 饿死(Starvation)与死锁(Dead Lock)问题76 4.2.6 资源隔离方法77 4.3 资源管理与调度系统范型77 4.3.1 集中式调度器(Monolithic Scheduler)78 4.3.2 两级调度器(Two—Level Scheduler) 79 4.3.3 状态共享调度器(Shared—State Scheduler) 79 4.4 资源调度策略81 4.4.1 FIFO 调度策略81 4.4.2 公平调度器(Fair Scheduler)81 4.4.3 能力调度器(Capacity Scheduler) 82 4.4.4 延迟调度策略(Delay Scheduling)82 4.4.5 主资源公平调度策略(Dominant Resource Fair Scheduling)82 4.5 Mesos 84 4.6 YARN87 参考文献90 第5 章 分布式协调系统91 5.1 Chubby 锁服务92 5.1.1 系统架构93 5.1.2 数据模型94 5.1.3 会话与KeepAlive 机制95 5.1.4 客户端缓存95 5.2 ZooKeeper 96 5.2.1 体系结构96 5.2.2 数据模型(Data Model) 97 5.2.3 API 98 5.2.4 ZooKeeper 的典型应用场景98 5.2.5 ZooKeeper 的实际应用103 参考文献104 第6 章 分布式通信106 6.1 序列化与远程过程调用框架107 6.1.1 Protocol Buffer 与Thrift 108 6.1.2 Avro109 6.2 消息队列110 6.2.1 常见的消息队列系统110 6.2.2 Kafka 111 6.3 应用层多播通信(Application—Level Multi—Broadcast)114 6.3.1 概述114 6.3.2 Gossip 协议115 参考文献118 第7 章 数据通道120 7.1 Log 数据收集120 7.1.1 Chukwa121 7.1.2 Scribe122 7.2 数据总线123 7.2.1 Databus125 7.2.2 Wormhole 127 7.3 数据导入/导出128 参考文献129 第8 章 分布式文件系统131 8.1 Google 文件系统(GFS) 132 8.1.1 GFS 设计原则132 8.1.2 GFS 整体架构133 8.1.3 GFS 主控服务器134 8.1.4 系统交互行为136 8.1.5 Colossus 137 8.2 HDFS 138 8.2.1 HDFS 整体架构139 8.2.2 HA 方案140 8.2.3 NameNode 联盟143 8.3 HayStack 存储系统145 8.3.1 HayStack 整体架构146 8.3.2 目录服务147 8.3.3 HayStack 缓存148 8.3.4 HayStack 存储系统的实现148 8.4 文件存储布局150 8.4.1 行式存储151 8.4.2 列式存储151 8.4.3 混合式存储156 8.5 纠删码(Erasure Code)158 8.5.1 Reed—Solomon 编码159 8.5.2 LRC 编码164 8.5.3 HDFS—RAID 架构166 参考文献166 …… 第9 章 内存KV 数据库168 第10 章 列式数据库176 第11 章 大规模批处理系统199 第12 章 流式计算219 第13 章 交互式数据分析240 第14 章 图数据库:架构与算法271 第15 章 机器学习:范型与架构313 第16 章 机器学习:分布式算法337 第17 章 增量计算366 附录A 硬件体系结构及常用性能指标378 附录B 大数据必读文献380
上传时间:2016-03 大小:67.62MB
- 69.39MB
大数据日知录完整的PDF哦
2019-06-13大数据日知录:架构与算法,完整清晰的PDF版,希望对大家能有所帮助
- 169B
《大数据日知录——架构与算法》PDF版本下载.txt
2019-07-17《大数据日知录——架构与算法》PDF版本下载
- 69.55MB
大数据日知录(架构与算法).pdf(带完整书签)
2019-04-16大数据日知录(架构与算法).pdf(带完整书签)可以作为学习大数据技术的入门书!
- 69.39MB
大数据日知录.zip
2019-06-13大数据日知录:架构与算法,完整清晰的PDF版,希望对大家能有所帮助
- 67.62MB
大数据-日知录-架构-算法(PDF高清完整版)
2017-11-23内容简介 大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件 体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。《大数据日知录:架构与算法》对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结构、大数据存储,以及包含批处理、流式计算、交互式数据分析、图数据库、并行机器学习的架构与算法以及增量计算等技术分支在内的大数据处理等几个大的方向。通过这种体系化的知识梳理与讲解,相信对于读者整体和系统地了解、吸收和掌握相关的优秀技术有极大的帮助与促进作用。 《大数据日知录:架构与算法》的读者对象包括对NoSQL 系统及大数据处理感兴趣的所有技术人员,以及有志于投身到大数据处理方向从事架构师、算法工程师、数据科学家等相关职业的在校本科生及研究生。
- 86.73MB
大数据日知录 架构与算法 jdm注释版
2016-06-03大数据日知录 架构与算法 jdm注释版
- 1016KB
《大数据日知录:架构与算法》
2017-07-22《大数据日知录:架构与算法》电子书
- 67.62MB
大数据日知录——架构与算法
2018-04-12《大数据日知录:架构与算法》对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结构、大数据存储,以及包含...
- 66.12MB
大数据日知录__架构与算法
2018-03-27大数据日知录__架构与算法大数据日知录__架构与算法大数据日知录__架构与算法
- 87.44MB
大数据日知录:架构与算法
2018-10-30大数据日知录:架构与算法
- 87.42MB
《大数据日知录:架构与算法》完整版+书签
2017-11-22《大数据日知录:架构与算法》完整版+书签 《大数据日知录:架构与算法》完整版+书签
- 87.43MB
大数据日知录__架构与算法---高清版.pdf
2017-03-19大数据日知录__架构与算法---高清版.pdf 个人收集电子书,仅用学习使用,不可用于商业用途,如有版权问题,请联系删除!
- 17.74MB
大数据日知录 可转化为PDF
2018-08-22可以通过转换软件转换为PDF,也可以直接导入KINDLE阅读。介绍了大数据领域里的基础知识,对大数据有个入门的概念。
- 69.45MB
大数据日知录_架构与算法
2018-01-24大数据日知录,架构与算法,程序员必读的架构读物之一
- 5.74MB
大数据时代下的数据连接.pdf
2019-08-04上海技术峰会,大数据时代下的数据连接
- 50.0MB
大数据日知录(1/2)
2016-04-25《大数据日知录:架构与算法》对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结构、大数据存储,以及包含...
- 3.55MB
大数据日知录.mmap
2020-10-15《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大...
- 50.0MB
大数据日知录.part1.rar
2016-05-27大数据日知录,架构与算法
- 138.65MB
大数据技术原理与应用
2019-04-17大数据技术 大数据技术
- 220KB
3.大数据生态圈.pdf
2019-07-263.大数据生态圈.pdf
- 2.36MB
大数据时代的科学数据战略(卢东明) 高清完整中文版PDF下载
2018-02-26大数据时代的科学数据战略(卢东明) 高清完整中文版PDF下载
- 34.4MB
这就是搜索引擎:核心技术详解.pdf 高清版 带目录
2018-04-19这就是搜索引擎:核心技术详解.pdf 高清版 带目录 这就是搜索引擎:核心技术详解.pdf 高清版 带目录 个人收集电子书,仅用学习使用,不可用于商业用途,如有版权问题,请联系删除!
- 50.0MB
大数据日知录_part1
2015-11-10大数据日知录,使用split分割,csdn只能支持60m文件,因此分割为两部分
- 0B
Qt 5实现串口调试助手 (源工程文件、0积分下载)
2021-12-06基于Qt 5实现串口调试助手,程序仅供参考,修改了之前十六进制接收0xA0--0xFF有误的问题,新增了窗口自适应(ui文件设置栅格),文件详情可看博客链接https://blog.csdn.net/m0_51294753/article/details/121405661。
- 47.24MB
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
2021-02-25SystemVerilog的听课学习笔记,包括讲义截取、知识点记录、注意事项等细节的标注。 目录如下: 第一章 SV环境构建常识 1 1.1 数据类型 1 四、二值逻辑 4 定宽数组 9 foreach 13 动态数组 16 队列 19 关联数组 21 枚举类型 23 字符串 25 1.2 过程块和方法 27 initial和always 30 function逻辑电路 33 task时序电路 35 动态 静态变量 39 1.3 设计例化和连接 45 第二章 验证的方法 393 动态仿真 395 静态检查 397 虚拟模型 403 硬件加速 405 效能验证 408 性能验证 410 第三章 SV组件实现 99 3.1 接口 100 什么是interface 101 接口的优势 108 3.2 采样和数据驱动 112 竞争问题 113 接口中的时序块clocking 123 利于clocking的驱动 133 3.3 测试的开始和结束 136 仿真开始 139 program隐式结束 143 program显式结束 145 软件域program 147 3.4 调试方法 150 第四章 验证的计划 166 4.1 计划概述 166 4.2 计划的内容 173 4.3 计划的实现 185 4.4 计划的进程评估 194 第五章 验证的管理 277 6.1 验证的周期检查 277 6.2 管理三要素 291 6.3 验证的收敛 303 6.4 问题追踪 314 6.5 团队建设 321 6.6 验证的专业化 330 第六章 验证平台的结构 48 2.1 测试平台 49 2.2 硬件设计描述 55 MCDF接口描述 58 MCDF接口时序 62 MCDF寄存器描述 65 2.3 激励发生器 67 channel initiator 72 register initiator 73 2.4 监测器 74 2.5 比较器 81 2.6 验证结构 95 第七章 激励发生封装:类 209 5.1 概述 209 5.2 类的成员 233 5.3 类的继承 245 三种类型权限 protected/local/public 247 this super 253 成员覆盖 257 5.4 句柄的使用 263 5.5 包的使用 269 第八章 激励发生的随机化 340 7.1 随机约束和分布 340 权重分布 353 条件约束 355 7.2 约束块控制 358 7.3 随机函数 366 7.4 数组约束 373 7.5 随机控制 388 第九章 线程与通信 432 9.1 线程的使用 432 9.2 线程的控制 441 三个fork...join 443 等待衍生线程 451 停止线程disable 451 9.3 线程的通信 458 第十章 进程评估:覆盖率 495 10.1 覆盖率类型 495 10.2 功能覆盖策略 510 10.3 覆盖组 516 10.4 数据采样 524 10.5 覆盖选项 544 10.6 数据分析 550 第十一章 SV语言核心进阶 552 11.1 类型转换 552 11.2 虚方法 564 11.3 对象拷贝 575 11.4 回调函数 584 11.5 参数化的类 590 第十二章 UVM简介 392 8.2 UVM简介 414 8.3 UVM组件 420 8.4 UVM环境 425
- 131.54MB
AutoSAR标准协议4.2.2
2020-01-19AutoSAR标准协议规范4.2.2,里面包含了AutoSAR组织所规定的AutoSAR架构的标准规范协议原文档。对AutoSAR的学习有一定的借鉴意义
- 2.13MB
光伏-储能并网系统仿真.rar
2021-12-31该文件是清华大学储能课的期末大作业。用SIMULINK搭建了一个完整的光伏-储能并网系统。我的博客中介绍了系统实现的具体方法,欢迎查看!
- 35KB
NPPJSONViewer.zip
2022-01-17NodePad++ JSON格式化插件
- 339KB
GD32替换STM32注意事项.pdf
2020-04-12GD32 介绍与 STM32 兼容性汇总。STM32的代码直接在GD32上运行需要小部分的修改。按教程做对应修改就行哈。