img
share 分享

推荐系统实践

作者:项亮

出版社:北京图灵文化发展有限公司

ISBN:9787115281586

VIP会员免费 (仅需0.8元/天) ¥ 19.99

温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!

电子书推荐

更多资源 展开

百度云盘 pdf《大数据架构和算法实现之路:电商系统的技术实战》百度云盘-带标签目录 评分:

目录 c~11tcob 推荐序 1.6.4 使用 R 进行 K 最近邻分类…·37 前言 1.6.5 单机环境使用 Mahout 运行 引子 第一篇支持高效的运营 第 1 章方案设计和技术选型:分类 ·5 1.1 分类的基本概念…...... .…………….. 6 1.2 分类任务的处理流程 ……·· ……·7 1.3 算法:朴素贝叶斯和 K最近邻……·8 1.3.1 朴素贝叶斯….......……… …….. 8 1.3.2 K 最近邻……………………... 9 1.4 分类效果评估…………·…….. 10 1.5 相关软件: R 和 Mahout·………….. 12 1.5.1 R 简介………………………… 12 1.5.2 Mahout 简介……………….. 13 1.5.3 Hadoop 简介………………· 14 1.6 案例实践·……...... .… ··· ·· ·········… 17 1.6.l 实验环境设置…………….... 17 1.6.2 中文分词 ……………….. 18 1.6.3 使用 R进行朴素贝叶斯分类… 22 朴素贝 叶斯分类..... . .…......... 39 1.6.6 多机环境使用 Mahout 运行 朴素贝叶斯分类…..........…… 47 1.7 更多的思考……….. .... ................. 58 第 2 章方案设计和技术选型: 聚类… … … ..... 60 2.1 聚类的基本概念…………........….. 60 2.2 算法: K 均值和层次型聚类…… 61 2.2.1 K 均值聚类………… ... ......… 61 2.2.2 层次型聚类……………… ·· 62 2.3 聚类的效果评估…·· ……....... 64 2.4 案例实践……………………··· ···· 66 2.4.1 使用 R 进行 K 均值聚类·· .... 66 2.4.2 使用 Mahout 进行 K均值聚类… 69 第 3 章方案设计和技术选型: 因变量连续的回归分析....... 74 3.1 线性回归的基本概念…………....... 74 3.2 案例实践… 3.2. 1 实验环境设置……………….. 76 3.2.2 R 中数据的标准化……… 78 3.2.3 使用 R 的线性回归分析…… ·81 第二篇 为顾客发现喜欢的商晶: 基础篇 第 4 章方案郎,+和技术选型:搜索 . 94 4.1 搜索引擎的基本概念………………·” 4 1 1 相关性…………………………· 95 4 口及时性…·.............… 97 4.2 搜索引擎的评估.........……········· 100 4.3 为什么不是数据库……........……. 103 4.4 系统框架………………… · 104 4.4.1 离线预处理…………………… 104 4.4.2 在线查询………… ……··· 107 4.5 常见的搜索引擎实现………... 108 4.5.1 Lucene 简介……………… 108 4.5.2 Solr 简介 ......………………… 113 4.5.3 Elasticsearch 简介…………… · 120 4.6 案例实践……………… 123 4.6.1 实验环境设置.. ... ....………… 123 4.6.2 基于 Solr 的实现 …………… 123 4.6.3 基于 Elasticsearch 的实现 … 154 4.6.4 统一的搜索 API ………··……·175 第三篇 为顾客发现喜欢的商局: 高级篇 第 5 章方案设计和技术选型: NoSQL 和搜索的整合· .. 195 5.1 问题分析 …… IX 5.2 HBase 简介……….. ... .. .…...... . …. 196 5.3 结合 HBase 和搜索引擎………….. 203 5.4 案例实践….... . . . .………........…… 204 5.4.1 实验环境设置 ........ ……··204 5.4.2 HBase 的部署………………… 205 5.4.3 HBase 和搜索引擎的集成 …. . 211 第 6 章方案设计和技术选型: 查询分类和搜索的整合 ·219 6.1 问题分析…………………. . 219 6.2 结合分类器和搜索引擎.. ....……. . 219 6.3 案例实践…······ ·············………… 225 6.3.1 实验环境设置……….......… 225 6.3.2 构建查询分类器 …………······226 6.3.3 定制化的搜索排序…… ··· ·229 6.3.4 整合查询分类和定制化 排序…·… …… ………… 236 第 7 章方案设计和技术选型: 个性化搜索 …· · … 245 7.1 问题分析……………………. ....... . . 245 7.2 结合用户画像和搜索引擎…… ··· 245 7.3 案例实践….........……….......…… 249 7.3.1 用户画像的读取……………… 250 7.3.2 个性化搜索引擎………·· 253 7.3.3 结果对比……………… ··260 第 8 章方案设计和技术选型: 搜索分片 ……·· ····· 267 8.1 问题分析……. ........... . . .………… 267 8.2 利用搜索的分片机制……………··269 x 8.3 案例实践 …………· · · ·· ·· · ····· ·….... . .. . . 271 8.3.1 Solr 路由的实现.. ......... . ...... 271 8.3.2 Elasticsearch 路由的实现 ……· 278 第 9 章 方案设计和技术选型: 搜索提示………….. ..... 283 9.1 问题分析 ……..... . ..….............… 283 9.2 案例实践:基础方案 ..............… 284 9.2.1 Solr 搜索建议和拼写纠错的 实现…….. ... ..…………·· · ···· · 284 9.2.2 Elasticsearch 搜索建议和拼写 纠错的实现 …··..........……… 286 9.3 改进方案 .. . .. . ..... .. ... . .. . .... . ..... . … 291 9.4 案例实践:改进方案 ….... . ....…·· 294 第 10 章方案设计和技术选型: 推荐 ……… ……….. 303 10.l 推荐系统的基本概念 ……......…· 305 10.2 推荐的核心要素…………········ 306 10.2.1 系统角色 .. . .. . ...…………·· 306 10.2.2 相似度 …. . ... . .......... . .…·· 307 10.2.3 相似度传播框架 .... . ....…·· 307 10.3 推荐系统的分类 . . . ... . ..….... ... .. . 307 10.4 混合模型. ··r ..………................. 311 10.5 系统架构… . .. ..........…..... . . … . .. 312 10.6 Mahout 中的推荐算法…….. ... .... 313 10.7 电商常见的推荐系统方案……… 314 10.7.1 电商常见的推荐系统 方案……………………….. 314 10.7.2 相似度的计算 …………….. 317 10.7.3 协同过滤………………….. 319 10.7.4 结果的查询………………·· 320 10.8 案例实践 ……………. ... ....… 321 10.8.1 基于内容特征的推荐…... 321 10.8.2 基于行为特征的推荐…….. 341 第四篇获取数据,跟踪效果 第 11 章方案设计和技术选型: 行为跟踪 … ……….... 369 l l.l 基本概念… . .... . ...... .... ....….. . .... 370 11.1.1 网站的核心框架……….. 370 11.1.2 行为数据的类型 … …… . . . . 371 11.1.3 行为数据的模式…………··372 11.1.4 设计理念…………………·· 374 11.2 使用谷歌分析 ..... . ..……… …. . . 375 11.3 自行设计之 Flume、 HDFS 和 Hive 的整合…·········· ···········…· 378 11.3.1 数据的收集一-Flume 简介…………………········ 378 11.3.2 数据的存储一-Hadoop HDFS 回顾………·…… 382 11 .3.3 批量数据分析一-Hive 简介 ……··..................… 383 11.3.4 Flume、 HDFS 和 Hive 的 整合方案 …··.......... .....… 386 11.4 自行设计之 Flume、 Kafka 和 Storm 的整合……………··…… 386 11.4.1 实时性数据分析之 Kafka 简介 ……….......……....... 386 11.4.2 实时性数据分析之 Storm 简介………………·388 11.4.3 Flume 、 Kafka 和 Storm 的 XI 11.5.4 自主设计实战之 Flume、 HDFS 和 Hive 的整合........ 401 11.5.5 自主设计实战之 Flume、 整合方案………………….. 390 Kafka 和 Storm 的整合……410 11.5 案例实践…………………….. 391 11.6 更多的思考………·……………·424 11.5.1 数据模式的设计……....... . 392 11.5.2 实验环境设置………… ... 392 后记……··…. ... .. .......….. .. . . .….............. 425 11.5.3 谷歌分析实战…………….. 394

...展开详情
上传时间:2018-08 大小:64B
热门图书