4.1 Mahout
《大数据》配套 PPT 课件
Mahout 简介
定义: Apache Mahout 是一个由 Java 语言实现
的开源的可扩展的机器学习算法库
2008 年之
前
2010 年以
后
Apache Lucene 开源搜索引擎的子项目
实现 Lucene 框架中的聚类以及分类算法
吸纳协调过滤项目 Taste 成为独立子项目
发
展
历
史
成为 Apache 顶级项目
实现聚类、分类和协同过滤等机器学习算法
既可以单机运行也可在 Hadoop 平台上运行
目标:机器学习平台,提供类似 R 的 DSL 以支持线性代数运算(如分布式向量计
算)、大数据统计等基本功能
驱象人
of
44
3