Mining-Frequent-Pattern-from-Search-History:《大数据挖掘技术》@复旦课程项目，试图从搜狗实验室用户查询日志数据（2008）中找出搜索记录中有较高支持度关键词的频繁二项集。在实现层面上，我搭建了一个由五台服务器组成的微型Hadoop集群，并且用Python实现了ParallelFP-Growth算法中的三个MapReduce过程_搜狗实验室资源-CSDN文库

共22个文件

py：19个

pdf：1个

txt：1个

需积分: 10 76 浏览量 2021-05-02 19:53:25 上传评论 1 收藏 1.57MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

package

Mining-Frequent-Pattern-from-Search-History-master.zip （22个子文件）

folder

Mining-Frequent-Pattern-from-Search-History-master

folder

src

folder

preprocess

format_file.py 2KB

gb2utf8.py 1KB

__init__.py 0B

format_file_v2.py 3KB

to_db_jieba.py 2KB

utils.py 500B

to_db.py 2KB

__init__.py 0B

mapper2.py 508B

statistics.py 1KB

reducer2.py 2KB

reducer3.py 964B

reducer1.py 936B

mapper1.py 241B

mapper3.py 312B

folder

demo

find_pair_nojieba.py 815B

find_pair.py 1KB

combine_parts.py 743B

res.txt 2.19MB

sort_kv.py 2KB

folder

doc

搜索记录频繁模式挖掘.pdf 717KB

README.md 6KB

内容反馈

AR新视野

粉丝: 25
资源: 4651

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip