推荐弹性
基于 GroupLens 电影数据在 ElasticSearch 中部署推荐引擎
需要在独立模式下运行 Mahout 和 Elasticsearch - 也可以在 Hadoop 集群上运行。
原始数据
u.item - 1,682 部电影的电影元数据(以竖线分隔)
u.data - 用户/项目评分(制表符分隔)
创建用于索引的文件
python metaData.py > index.json (python 脚本,用于读取项目并写入 JSON 以进行批量加载)
./genLogLikelihood (这会运行 Mahout 作业并将类似的项目写入 output/part-r-00000
python indicator.py > update.json (python 脚本读取 mahout 输出并写入 JSON 以进行批量更新)
创建并加载索引
bin/elast