News-Recommend-System
=========================================================================================
##Global_param中设置参数说明:
number_jieba:控制提取关键词的数量
number_day:从第一天开始,要预测的天数
hot_rate:预测集预测的新闻热度,数值越大热度越高
##代码流程:
#####首先我们从main()看起。
#####1.首先Get_day_data.TransforData(i)函数,找到最后一次浏览的是第i天的新闻的用户行为,存放在test/train_lastday_set目录下。
#####2.Get_day_data.TransforDataset(i)函数,区分每一天的新闻,存放在test/train_date_set1目录下
#####3.Get_keywords.Get_keywords(i)函数,调用jieba库,挑出每一天最火的分层,存放在test/key_words下
#####4.Get_keynews.Get_keynews(i)函数,通过每一个用户最后一次浏览的新闻,比对看有没有出现当天的热门keywords。如果出现,就推荐当天包含这个keywords的其它新闻。循环Global_param.number_day天,生成test/result.txt文件.
#####5. Delete_Repeat.Delete_Repeat()函数,去除result中的重复项,生成test/result_no_repeat.txt
#####6.Get_hot_result.get_hot_result(Global_param.hot_rate)函数,因为上面生成result_no_repeat函数可能出现,每个用户推荐过多的情况,影响准确率。所以用这个函数控制数量,每个用户只推荐新闻热度相对高的候选项。最终结果集test/result_no_repeat_hot.txt
##详情可见:http://blog.csdn.net/buptgshengod
没有合适的资源?快使用搜索试试~ 我知道了~
资源详情
资源评论
资源推荐
收起资源包目录
基于python的新闻推荐系统.zip (181个子文件)
test.csv 155KB
README.md 2KB
prob_emit.p 1.45MB
char_state_tab.p 1.03MB
prob_emit.p 585KB
prob_trans.p 127KB
prob_start.p 6KB
prob_trans.p 146B
prob_start.p 62B
org.eclipse.core.resources.prefs 350B
.project 364B
prob_emit.py 3.89MB
char_state_tab.py 1.55MB
prob_emit.py 1.29MB
prob_trans.py 242KB
__init__.py 13KB
__init__.py 7KB
prob_start.py 7KB
__init__.py 3KB
__init__.py 2KB
Get_keynews.py 2KB
viterbi.py 2KB
analyzer.py 1KB
Get_user_last_constant.py 1KB
Get_hot_result.py 1KB
Find_Null.py 1KB
Delete_Repeat.py 943B
Put_list_to_dic.py 909B
Get_day_data.py 873B
Get_user_last_data.py 854B
Achieve_csv.py 651B
Get_news_rate.py 592B
RepeatReview.py 568B
Date_manage.py 518B
Find_Top.py 498B
Get_keywords.py 472B
Main.py 432B
HandleData.py 425B
Count_line_num.py 414B
prob_trans.py 241B
print_list_dic.py 202B
Global_param.py 137B
prob_start.py 93B
__init__.py 0B
__init__.py 0B
__init__.py 0B
prob_emit.pyc 1.02MB
char_state_tab.pyc 799KB
prob_emit.pyc 501KB
prob_trans.pyc 119KB
__init__.pyc 14KB
__init__.pyc 9KB
prob_start.pyc 8KB
__init__.pyc 3KB
__init__.pyc 3KB
analyzer.pyc 2KB
viterbi.pyc 2KB
Get_keynews.pyc 2KB
Find_Null.pyc 1KB
Get_day_data.pyc 1KB
Get_hot_result.pyc 1KB
Put_list_to_dic.pyc 1KB
Delete_Repeat.pyc 1KB
Find_Top.pyc 985B
RepeatReview.pyc 924B
Get_keywords.pyc 906B
Date_manage.pyc 870B
Achieve_csv.pyc 869B
Get_news_rate.pyc 846B
Main.pyc 792B
HandleData.pyc 767B
print_list_dic.pyc 628B
Count_line_num.pyc 581B
Global_param.pyc 378B
prob_trans.pyc 369B
prob_start.pyc 268B
__init__.pyc 170B
__init__.pyc 160B
.pydevproject 420B
train_date_set1.txt 6.01MB
idf.txt 5.91MB
dict.txt 4.84MB
train_lastdat_set1.txt 675KB
train_date_set1_3.txt 624KB
train_date_set1_14.txt 467KB
train_date_set1_10.txt 441KB
train_lastdat_constant_set1.txt 440KB
train_date_set1_12.txt 389KB
train_date_set1_4.txt 383KB
train_date_set1_13.txt 363KB
result.txt 331KB
result_no_repeat.txt 310KB
train_date_set1_5.txt 292KB
train_date_set1_19.txt 289KB
train_date_set1_11.txt 235KB
train_date_set1_6.txt 227KB
train_date_set1_9.txt 215KB
train_date_set1_18.txt 199KB
train_date_set1_2.txt 185KB
train_date_set1_8.txt 178KB
共 181 条
- 1
- 2
胸中有数-数分版
- 粉丝: 7383
- 资源: 20
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- springboot校园管理系统的设计与实现
- RV1126 核心板资料
- springboot基于SpringBoot的旅游网站的设计与实现
- MATLAB实现智能水滴算法(Intelligent Water Drops Algorithm, IWDA)
- 2023-04-06-项目笔记 - 第三百零八阶段 - 4.4.2.306全局变量的作用域-306 -2025.11.05
- 2024年硕士计量经济学作业1-空白.ipynb
- 【完整源码+数据库】 SpringBoot Metrics 监控系统完整源码分享给需要的同学
- Carla 0.9.15编译的zlib-1.2.13.zip
- 【源码+数据库】基于springboot+mysql实现的校园二手市场平台
- Carla 0.9.15编译的xerces-c-3.23-src
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0