【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的竞赛项目学习资料,作为参考学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 CCF城市自行车的出行行为分析及效率优化赛题-top10解题方案源码+学习说明.zip ### 1. 赛题概述: - **赛题网站:** [CCF 大数据与计算智能大赛](http://www.datafountain.cn/projects/2017CCF/) - **背景:** 城市共享单车体系逐步渗透到各个城市中,给公众出行的“最后一公里”带来极大便利。随着用户使用量增长和频度的增加,如优化运营效率是随之而来的重要课题。同时,站在城市管理的角度上,共享单车的使用状况也投射出城市人口流动特征,对城市规划、城市交通管理有重要参考价值。 - **赛题数据:** 赛题数据为2015年某城市的自行车数据,数据为完整的真实数据,提供的数据中,对车卡信息进行了脱敏。这里以复赛的数据为准,复赛训练集提供2015年1-8月份的真实数据,样本量为2132693条。具体各维度的信息参见官网。 除此之外,官方还提供一些各个站点的粗糙的经纬度数据。 - **赛题目标:** 预测未来两个月,即2015年9月和10月各个自行车站点的每天的借车和还车的流量。 - **测评函数:** *score=1/(1+RMSE)* - 【备注】:可以使用外部数据,如天气数据等。 ---------- ### 2.代码运行环境: - python3.6 - pandas(0.20.3) - numpy(1.13.3) - scikit-learn(0.19.1) - xgboost ------- ### 3.核心代码说明: - **预处理:** - 对于某些记录数据出现骑行时间小于30秒的骑行时间进行丢弃处理。 - 对某些站点可能出现某个时间之后流量为0,可能原因是该站点拆除了。如下站点: ![站点异常](https://github.com/Changzhisong/CCF_BikeTrafficForecast_Top10/blob/master/images/站点134.png) - 数据分布大量纯在偏小的流量,如下还车的数据分组分布。对数据流量log(1+x)处理 ![流量分布](https://github.com/Changzhisong/CCF_BikeTrafficForecast_Top10/blob/master/images/train_mean_rt.png) - 异常点处理:以历史过去14天流量的μ±2σ为限制,其中μ为均值,σ为均方根,以排除异常的流量数据 ![站点异常](https://github.com/Changzhisong/CCF_BikeTrafficForecast_Top10/blob/master/images/站点39.png) - **特征工程:** - 对根据粗糙的经纬度进行聚类处理,因为在市区人口密集的地方的周围的站点的流量数据都会很大,然后相对郊区的站点的流量数据较小。虽然经纬度不够精确,但对最终结果有所提高。 - 加入天气数据:通过爬虫爬取了盐城市2015年前10个月的天气数据。天气数据来源:www.wunderground.com, 提供了世界各地的气象信息,包含气温,露点,湿度,气压,能见度,风速,瞬时风速,降水量,天气状况等信息。对这些信息构建特征。 - 生成人体舒适度指数SSD SSD=(1.818t+18.18)(0.88+0.002f)+(t-32)/(45-t)-3.2v+18.2 其中:温度t,湿度f,风速v。 - 节假日特征:对节假日数据进行标记为1,非节假日为0。如下图某站点节假日,雨天与流量的关系,其中黑色点代表节假日与非节假日,红色点为下雨天与非下雨天: ![节假日](https://github.com/Changzhisong/CCF_BikeTrafficForecast_Top10/blob/master/images/站点18.jpg) - 星期几特征: 当天为星期几,one-hot处理 - 周末特征:当天是否周末 - 暑假特征:观察数据发现在7,8月份数据普遍偏高,因此应该是暑假到来引发的,后续验证确实有效。 - 季节特征:不同的季节对流量是有影响的 - 月份特征:因给定的数据一年都不够,于是这里划分是根据认为感知划分的,即认为11,12,1,2为一个组,3,4,9,10为一
- 1
- 粉丝: 1518
- 资源: 5643
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- docker一键安装包
- Screenshot_20240430_144340_com.ss.android.ugc.live.jpg
- 回到山沟沟.mp3
- 基于matlab实现自适应波束形成RLS及LMS算法仿真源程序1.rar
- 基于matlab实现自己编写的基于卡尔曼滤波的利用加速度传感器的计步器,测试数据是传感器放在腰部和手臂 .rar
- 基于matlab实现阵列信号处理,波束形成.rar
- 111111111111111111
- 基于matlab实现计步器编程;对当前的计步器装置的数值算法模拟 .rar
- Mdb学习查看PW;access;mdb;pw;password;patch
- 基于matlab实现关于语音信号声源定位DOA估计所用的一些传统算法.rar