##大工搜索引擎与文本挖掘课程作业
这是基于阿里移动推荐算法竞赛的一份作业。
作业评测网址为:ir.dlut.edu.cn/onlinejudge
本项目主要应用于对阿里移动推荐算法竞赛的数据处理,特征提取及训练等。
YML.BPN项目是c++实现的BP神经网络的源代码
FeatureController是C#实现的用于抽取434维特征的特征抽取程序,使用前需要配置App.Config中的数据库连接字符串
GBDT的代码并没有单独提取出来,而是在BPNetwork工程中GBDT.py的文件中
###下面是阿里移动推荐算法竞赛第二期数据的一些统计:
共包含消费记录:12256906条
包含o2o商品id数:480723条,去重后为310582条
(有些商品会同时属于多个类别,所以去重之后记录数减少了)
###特征包括:
购物车转化率:购买的/加入购物车量,注意对用户及商品进行分别统计
收藏转化率:购买的/收藏量
点击转化率:购买量/点击量
转化率说明:这里的收藏对于一个用户来说只是一个商品状态,只能有一次记录,不像点击操作,同一个用户可以进行很多次。
所以这里的收藏转化率是指,在已经收藏了该商品的用户里,有多少个用户购买了。
则可以看出,点击转化率有两个概念
1. 在已经点击过该商品的用户中,有多少个用户购买了。
2. 该商品平均被点击多少次,会被购买。(后期计算即可得出)
###实验记录
1. 用1天的数据进行LR训练,结果在2.3~4%之间,加上转化率特征之后,结果会变差
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的竞赛项目学习资料,作为参考学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 阿里移动推荐算法竞赛参赛源码+项目说明.zip
资源推荐
资源详情
资源评论
收起资源包目录
阿里移动推荐算法竞赛参赛源码+项目说明.zip (118个子文件)
6.处理训练样本.bat 334B
7.处理测试样本.bat 286B
扩展样本.bat 184B
ClassDiagram1.cd 59B
App.config 1KB
packages.config 222B
BPNetwork.cpp 7KB
BPLayer.cpp 5KB
SampleLoader.cpp 3KB
main.cpp 2KB
AnswerModel.cpp 228B
SampleModel.cpp 182B
UserFeature.cs 6KB
FeatureCollection.cs 6KB
BaseFeature.cs 6KB
FeatureManager.cs 5KB
BehaviorCollection.cs 4KB
ItemFeature.cs 4KB
CategoryFeature.cs 4KB
DataAnalyser.cs 3KB
Global.cs 3KB
Program.cs 2KB
HourCountCollection.cs 2KB
UserItemFeature.cs 2KB
AssemblyInfo.cs 1KB
AliRecommendModel.Context.cs 1005B
StreamHelper.cs 902B
T_UserAction.cs 858B
AliRecommendModel.Designer.cs 747B
T_Item.cs 710B
UserCategoryFeature.cs 484B
Utils.cs 437B
AliRecommendModel.cs 408B
FeatureController.csproj 5KB
result.csv 120KB
20141212.csv 31KB
20141127.csv 9KB
20141208.csv 8KB
20141216.csv 8KB
20141215.csv 8KB
20141214.csv 8KB
20141203.csv 8KB
20141201.csv 8KB
20141126.csv 8KB
20141207.csv 8KB
20141213.csv 8KB
20141125.csv 8KB
20141209.csv 8KB
20141204.csv 8KB
20141118.csv 8KB
20141124.csv 7KB
result.csv 7KB
result10_1.csv 7KB
20141217.csv 7KB
20141130.csv 7KB
20141120.csv 7KB
20141119.csv 7KB
20141202.csv 7KB
20141210.csv 7KB
20141122.csv 7KB
20141206.csv 7KB
20141123.csv 7KB
20141211.csv 7KB
20141128.csv 6KB
20141121.csv 6KB
20141129.csv 6KB
20141205.csv 6KB
AliRecommendModel.edmx.diagram 751B
AliRecommendModel.edmx 6KB
YML.BPN.vcxproj.filters 2KB
.gitattributes 2KB
.gitignore 3KB
BPLayer.h 1KB
BPNetwork.h 1KB
SampleLoader.h 542B
AnswerModel.h 191B
SampleModel.h 157B
README.md 2KB
LR.py 9KB
Train.py 4KB
BPNetwork.py 3KB
3expandfeature.py 2KB
Tester.py 2KB
41standard.py 2KB
BinReader.py 2KB
Normailzer.py 2KB
OldBinReader.py 2KB
BinConverter.py 2KB
BinReader.py 2KB
5csv2bin.py 2KB
4normalize.py 2KB
Test.py 1KB
1.数据库导入格式化.py 1KB
TestBin.py 1KB
GBDT.py 1KB
2sampling.py 1KB
GBDT_demo.py 1KB
合并训练集.py 940B
BinWriter.py 839B
GetTopN.py 680B
共 118 条
- 1
- 2
资源评论
土豆片片
- 粉丝: 1517
- 资源: 5643
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 蓝桥杯2024年第十五届省赛真题-前缀总分
- com.qihoo.appstore_300101305-1.apk
- tensorflow-gpu-2.7.1-cp37-cp37m-manylinux2010-x86-64.whl
- tensorflow-2.7.2-cp37-cp37m-manylinux2010-x86-64.whl
- tensorflow-2.7.1-cp39-cp39-manylinux2010-x86-64.whl
- 蓝桥杯2024年第十五届省赛真题-传送阵
- com.qihoo.appstore_300101305.apk
- linux之线程同步一.doc
- keil5配色方案10种
- python烟花代码.doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功