Ali_Data_Mining
===============
阿里巴巴大数据竞赛
[官网](http://102.alibaba.com/competition/addDiscovery/index.htm)
## 简介
在天猫,每天都会有数千万的用户通过品牌发现自己喜欢的商品,品牌是联接消费者与商品最重要的纽带。本届赛题的任务就是根据用户4个月在天猫的行为日志,建立用户的品牌偏好,并预测他们在将来一个月内对品牌下商品的购买行为。
## 数据类型
- 字 段 字段说明 提取说明
- user_id 用户标记 抽样&字段加密
- Time 行为时间 精度到天级别&隐藏年份
- action_type 用户对品牌的行为类型 包括点击、购买、加入购物车、收藏4种行为 (点击:0 购买:1 收藏:2 购物车:3)
- brand_id 品牌数字ID 抽样&字段加密
用户对任意商品的行为都会映射为一行数据。其中所有商品ID都已汇总为商品对应的品牌ID。用户和品牌都分别做了一定程度的数据抽样,且数字ID都做了加密。所有行为的时间都精确到天级别(隐藏年份)。
## 评估指标
最后我们用F1-Score 来拟合准确率与召回率,并且大赛最终的比赛成绩排名以F1得分为准。
## 实现算法
- 协同过滤
简单建模,效果很差
- 逻辑回归
最好成绩:1111/0.06480648/0.05224964/5.785456
- 随机森林
最好成绩:1160/0.05344828/0.04499274/4.885737
- 贝叶斯
-ing
没有合适的资源?快使用搜索试试~ 我知道了~
阿里巴巴大数据竞赛.zip
共67个文件
r:13个
sql:13个
rmd:13个
需积分: 5 0 下载量 123 浏览量
2024-01-14
13:11:58
上传
评论
收藏 2.2MB ZIP 举报
温馨提示
大学生参加学科竞赛有着诸多好处,不仅有助于个人综合素质的提升,还能为未来职业发展奠定良好基础。以下是一些分析: 首先,学科竞赛是提高专业知识和技能水平的有效途径。通过参与竞赛,学生不仅能够深入学习相关专业知识,还能够接触到最新的科研成果和技术发展趋势。这有助于拓展学生的学科视野,使其对专业领域有更深刻的理解。在竞赛过程中,学生通常需要解决实际问题,这锻炼了他们独立思考和解决问题的能力。 其次,学科竞赛培养了学生的团队合作精神。许多竞赛项目需要团队协作来完成,这促使学生学会有效地与他人合作、协调分工。在团队合作中,学生们能够学到如何有效沟通、共同制定目标和分工合作,这对于日后进入职场具有重要意义。 此外,学科竞赛是提高学生综合能力的一种途径。竞赛项目通常会涉及到理论知识、实际操作和创新思维等多个方面,要求参赛者具备全面的素质。在竞赛过程中,学生不仅需要展现自己的专业知识,还需要具备创新意识和解决问题的能力。这种全面的综合能力培养对于未来从事各类职业都具有积极作用。 此外,学科竞赛可以为学生提供展示自我、树立信心的机会。通过比赛的舞台,学生有机会展现自己在专业领域的优势,得到他人的认可和赞誉。这对于培养学生的自信心和自我价值感非常重要,有助于他们更加积极主动地投入学习和未来的职业生涯。 最后,学科竞赛对于个人职业发展具有积极的助推作用。在竞赛中脱颖而出的学生通常能够引起企业、研究机构等用人单位的关注。获得竞赛奖项不仅可以作为个人履历的亮点,还可以为进入理想的工作岗位提供有力的支持。
资源推荐
资源详情
资源评论
收起资源包目录
阿里巴巴大数据竞赛.zip (67个子文件)
SJT-code
data
user_analysis_train.sql 3KB
brand_analysis.sql 903B
t_alibaba_data.csv 4.65MB
brand.csv 167KB
brand.RData 264KB
user_brand.csv 1.05MB
user_brand_analysis_train.sql 5KB
user.RData 36KB
user_brand_analysis.sql 1KB
user.csv 33KB
user_analysis.sql 903B
t_data.sql 6.92MB
user_analysis_sample.sql 1KB
user_brand_analysis_sample.sql 1KB
user_brand.RData 2.09MB
brand_analysis_sample.sql 1KB
base-analysis
user_brand_analysis_train.R 6KB
user_analysis_sample.R 1KB
brand_analysis_sample.R 1KB
user_brand_analysis.R 2KB
user_brand_analysis_mini.R 270B
user_brand_analysis_sample.R 3KB
user_analysis.R 1KB
brand_analysis.R 1KB
collaborative-filtering
cf2.Rmd 3KB
cf1.Rmd 3KB
cf_datas.R 5KB
compute.Rmd 3KB
cf_ub_scores.sql 2KB
cf_real_buy.R 946B
python
computerResult.py 2KB
recommender.py 10KB
data
brand.csv 167KB
real.csv 12KB
real3.csv 252B
user_brand_score.csv 623KB
result4.txt 807KB
user.csv 33KB
result2.txt 14KB
real_buy.csv 12KB
result3.txt 253B
result.txt 102KB
cf_score.csv 963KB
unit
demo.py 1KB
.project 379B
.pydevproject 472B
logistical-regression
lr_real_buy.R 937B
lr_user_brand_analysis_test.sql 3KB
lr_user_brand_analysis.R 14KB
lrdemo.Rmd 2KB
lr1.Rmd 2KB
lr_real_buy.sql 204B
computer_score.Rmd 1KB
lr_user_brand_analysis_train.sql 6KB
lrdemo.md 7KB
lrdemo.html 20KB
random-forest
lr_real_buy.R 937B
rf_demo.md 4KB
rf_demo.html 17KB
rf1.Rmd 2KB
rf_user_brand_analysis.Rmd 196B
computer_score.Rmd 1KB
rf_demo.Rmd 2KB
bayes
bayes1.Rmd 2KB
bayes_demo.Rmd 3KB
bayes_demo2.Rmd 4KB
README.md 1KB
共 67 条
- 1
资源评论
JJJ69
- 粉丝: 6324
- 资源: 5920
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 永磁同步电机转速PI控制,SMC滑模控制,ADRC自抗扰控制Simulink对比仿真模型 1.永磁同步电机SVPWM控制算法,实
- 西门子200SMART 5轴伺服控制程序 威纶屏 ST30+ST20 2个V90伺服+3个步进电机 该程序是实际项目中的
- 基于Python的nvrpro库实现的人脸8种表情检测设计源码
- 截图-Snipaste-1.14-x86
- 基于Java语言的CatVodTVSpider设计源码
- 基于Python Scrapy框架的链家二手房爬虫设计源码
- 基于Python Flask的高可用MVC框架设计源码
- 基于Android平台融合高德地图瓦片图层的BryantTileMap设计源码
- 基于Java语言的SpringCloud专题设计源码解析与实践
- 基于Java和Vue的水资源监测数据可视化系统SSM架构设计源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功