标题《Scaling up Machine Learning》和描述提到的是一本关于在并行和分布式计算平台上扩展机器学习和数据挖掘方法的论文集。这本书主要讨论了大数据背景下,如何将机器学习算法在分布式环境中进行规模化扩展。由于不同的应用场景对并行化机器学习算法的需求高度特定,它可能是由巨大的数据集大小驱动的,也可能是由模型复杂性或实时性能要求驱动的。在进行大规模机器学习时,做出适合特定任务的算法和平台选择,需要了解可选方案的优势、权衡和限制。 这本书的解决方案覆盖了从FPGA(现场可编程门阵列)和GPU(图形处理单元)到多核系统和商用集群的各种并行化平台。书中包括了并发编程框架如CUDA、MPI、MapReduce和DryadLINQ,并且介绍了监督学习、无监督学习、半监督学习和在线学习等多种学习设置。对于像梯度提升树、支持向量机、谱聚类、信念传播等多种流行学习算法的并行化进行了深入探讨,并且用几个应用案例进行了深入分析。 书中提及的几位作者,包括Dr.Ron Bekkerman、Dr.Mikhail Bilenko和Dr.John Langford,他们在机器学习和数据挖掘领域均有深厚的研究背景和实际工作经验。Ron Bekkerman的研究兴趣主要集中在大规模无监督学习上,而Mikhail Bilenko的研究关注于大型行为和文本数据集中的机器学习和数据挖掘任务,特别是利用用户行为来改进在线广告。John Langford则在雅虎担任高级研究员,专注于机器学习的研究。 本书内容涵盖以下几个核心知识点: 1. 并行化和分布式机器学习的必要性:在大数据和高性能计算要求下,传统的单机机器学习方法已不足以处理大规模数据。因此,将机器学习算法并行化并分布于多个计算节点变得至关重要。 2. 任务特定的并行化需求:不同的机器学习任务具有不同的并行化需求,比如数据集大小、模型复杂度和实时性能要求。这些需求决定了并行化策略的选择。 3. 并行化平台选择:并行化机器学习算法可以在多种平台上实现,包括FPGA、GPU、多核系统和商用集群。这些平台各有优劣,需要根据实际任务需求来选择最合适的平台。 4. 并发编程框架:书中介绍了CUDA、MPI、MapReduce和DryadLINQ等并发编程框架,这些框架为在不同硬件平台上实现并行化提供了基础和工具。 5. 各种学习设置:在并行化机器学习的同时,需要考虑不同学习场景,包括监督学习、无监督学习、半监督学习和在线学习。 6. 常见学习算法的并行化:对于各种流行的学习算法,比如梯度提升树、支持向量机、谱聚类和信念传播等,书中不仅详细介绍了它们的并行化方法,还提供了具体应用案例的深入分析。 7. 大规模无监督学习的研究:Ron Bekkerman和Mikhail Bilenko的工作集中在大规模无监督学习上,这反映了当前机器学习领域的一个重要研究方向。 本书的目标读者群体广泛,包括研究人员、学生和从业者,都可从这些针对大规模机器学习扩展的深入探讨中获益。书中的内容不仅提供了理论知识,也结合了实际应用,为读者提供了全面的学习和研究视角。
剩余493页未读,继续阅读
- wyinggui2017-10-03期待中文版
- Network-Framework2014-06-17超级赞的书,进阶性的书~
- SoloRabbit2015-11-07非常好的资源!
- hwwhbb2014-10-25对大规模数据 机器学习理论技术随之革新
- baidu_210805672018-01-20很有用的资源
- 粉丝: 4
- 资源: 44
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于java+springboot+vue+mysql的毕业生实习与就业管理系统设计与实现.docx
- 基于java+springboot+vue+mysql的船舶维保管理系统设计与实现.docx
- 基于java+springboot+vue+mysql的船运物流管理系统设计与实现.docx
- 基于java+springboot+vue+mysql的房地产销售管理系统设计与实现.docx
- 基于java+springboot+vue+mysql的航班进出港管理系统设计与实现.docx
- 基于java+springboot+vue+mysql的滑雪场管理系统设计与实现.docx
- 基于java+springboot+vue+mysql的甘肃旅游服务平台设计与实现.docx
- 基于java+springboot+vue+mysql的火车票订票系统设计与实现.docx
- 基于java+springboot+vue+mysql的集团门户网站设计与实现.docx
- 基于java+springboot+vue+mysql的计算机学院校友网设计与实现.docx
- 基于java+springboot+vue+mysql的家装服务管理系统设计与实现.docx
- 基于java+springboot+vue+mysql的家政服务平台设计与实现.docx
- 基于java+springboot+vue+mysql的教学资料管理系统设计与实现.docx
- 基于java+springboot+vue+mysql的考务报名平台设计与实现.docx
- 基于java+springboot+vue+mysql的考勤管理系统设计与实现.docx
- 基于java+springboot+vue+mysql的老年人体检管理系统设计与实现.docx