##大工搜索引擎与文本挖掘课程作业
这是基于阿里移动推荐算法竞赛的一份作业。
作业评测网址为:ir.dlut.edu.cn/onlinejudge
本项目主要应用于对阿里移动推荐算法竞赛的数据处理,特征提取及训练等。
YML.BPN项目是c++实现的BP神经网络的源代码
FeatureController是C#实现的用于抽取434维特征的特征抽取程序,使用前需要配置App.Config中的数据库连接字符串
GBDT的代码并没有单独提取出来,而是在BPNetwork工程中GBDT.py的文件中
###下面是阿里移动推荐算法竞赛第二期数据的一些统计:
共包含消费记录:12256906条
包含o2o商品id数:480723条,去重后为310582条
(有些商品会同时属于多个类别,所以去重之后记录数减少了)
###特征包括:
购物车转化率:购买的/加入购物车量,注意对用户及商品进行分别统计
收藏转化率:购买的/收藏量
点击转化率:购买量/点击量
转化率说明:这里的收藏对于一个用户来说只是一个商品状态,只能有一次记录,不像点击操作,同一个用户可以进行很多次。
所以这里的收藏转化率是指,在已经收藏了该商品的用户里,有多少个用户购买了。
则可以看出,点击转化率有两个概念
1. 在已经点击过该商品的用户中,有多少个用户购买了。
2. 该商品平均被点击多少次,会被购买。(后期计算即可得出)
###实验记录
1. 用1天的数据进行LR训练,结果在2.3~4%之间,加上转化率特征之后,结果会变差
没有合适的资源?快使用搜索试试~ 我知道了~
阿里移动推荐算法竞赛.zip
共119个文件
csv:33个
py:25个
cs:21个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 60 浏览量
2024-01-01
16:26:48
上传
评论
收藏 637KB ZIP 举报
温馨提示
全国大学生电子设计竞赛(National Undergraduate Electronics Design Contest),试题,解决方案及源码。计划或参加电赛的同学可以用来学习提升和参考。程序均是实战案例,经过测试可直接运行。 全国大学生电子设计竞赛(National Undergraduate Electronics Design Contest),试题,解决方案及源码。全国大学生电子设计竞赛(National Undergraduate Electronics Design Contest),试题,解决方案及源码。计划或参加电赛的同学可以用来学习提升和参考。程序均是实战案例,经过测试可直接运行。 全国大学生电子设计竞赛(National Undergraduate Electronics Design Contest),试题,解决方案及源码。
资源推荐
资源详情
资源评论
收起资源包目录
阿里移动推荐算法竞赛.zip (119个子文件)
6.处理训练样本.bat 334B
7.处理测试样本.bat 286B
扩展样本.bat 184B
ClassDiagram1.cd 59B
App.config 1KB
packages.config 222B
BPNetwork.cpp 7KB
BPLayer.cpp 5KB
SampleLoader.cpp 3KB
main.cpp 2KB
AnswerModel.cpp 228B
SampleModel.cpp 182B
UserFeature.cs 6KB
FeatureCollection.cs 6KB
BaseFeature.cs 6KB
FeatureManager.cs 5KB
BehaviorCollection.cs 4KB
ItemFeature.cs 4KB
CategoryFeature.cs 4KB
DataAnalyser.cs 3KB
Global.cs 3KB
Program.cs 2KB
HourCountCollection.cs 2KB
UserItemFeature.cs 2KB
AssemblyInfo.cs 1KB
AliRecommendModel.Context.cs 1005B
StreamHelper.cs 902B
T_UserAction.cs 858B
AliRecommendModel.Designer.cs 747B
T_Item.cs 710B
UserCategoryFeature.cs 484B
Utils.cs 437B
AliRecommendModel.cs 408B
FeatureController.csproj 5KB
result.csv 120KB
20141212.csv 31KB
20141127.csv 9KB
20141208.csv 8KB
20141216.csv 8KB
20141215.csv 8KB
20141214.csv 8KB
20141203.csv 8KB
20141201.csv 8KB
20141126.csv 8KB
20141207.csv 8KB
20141213.csv 8KB
20141125.csv 8KB
20141209.csv 8KB
20141204.csv 8KB
20141118.csv 8KB
20141124.csv 7KB
result.csv 7KB
result10_1.csv 7KB
20141217.csv 7KB
20141130.csv 7KB
20141120.csv 7KB
20141119.csv 7KB
20141202.csv 7KB
20141210.csv 7KB
20141122.csv 7KB
20141206.csv 7KB
20141123.csv 7KB
20141211.csv 7KB
20141128.csv 6KB
20141121.csv 6KB
20141129.csv 6KB
20141205.csv 6KB
AliRecommendModel.edmx.diagram 751B
AliRecommendModel.edmx 6KB
YML.BPN.vcxproj.filters 2KB
.gitattributes 2KB
.gitignore 3KB
BPLayer.h 1KB
BPNetwork.h 1KB
SampleLoader.h 542B
AnswerModel.h 191B
SampleModel.h 157B
README.md 2KB
LR.py 9KB
Train.py 4KB
BPNetwork.py 3KB
3expandfeature.py 2KB
Tester.py 2KB
41standard.py 2KB
BinReader.py 2KB
Normailzer.py 2KB
OldBinReader.py 2KB
BinConverter.py 2KB
BinReader.py 2KB
5csv2bin.py 2KB
4normalize.py 2KB
Test.py 1KB
1.数据库导入格式化.py 1KB
TestBin.py 1KB
GBDT.py 1KB
2sampling.py 1KB
GBDT_demo.py 1KB
合并训练集.py 940B
BinWriter.py 839B
GetTopN.py 680B
共 119 条
- 1
- 2
资源评论
xiaoshun007~
- 粉丝: 3782
- 资源: 3146
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功