# 1st Place Solution for 2016CCF StateGrid UserProfile
赛题链接:http://www.wid.org.cn/data/science/player/competition/detail/description/242
## 任务介绍
在复赛中,参赛者需要以电力用户的95598工单数据、电量电费营销数据等为基础,综合分析电费敏感客户特征,建立客户电费敏感度模型,对电费敏感用户的敏感程度进行量化评判,帮助供电企业快速、准确的识别电费敏感客户,从而对应的提供有针对性的电费、电量提醒等精细化用电服务。
## 解决方案
详细解决方案pdf戳[这里](https://github.com/feidapeng/2016CCF_StateGrid_UserProfile/blob/master/%E5%AE%A2%E6%88%B7%E7%94%BB%E5%83%8F%E6%AF%94%E8%B5%9B%E8%A7%A3%E5%86%B3%E6%96%B9%E6%A1%88.pdf)
## 代码运行说明
按照95598工单记录次数对用户分为两类,分别构造特征和建模。
- [x] 将只有一条95598记录的用户定义为**低敏感度用户**,用A或者single指代
- [x] 将有多条95598记录的用户定义为**高敏感度用户**,用B或者multi指代
### 1.配置说明
程序依赖python3及以下程序包
> * anaconda3
> * xgboost
> * jieba
程序运行需要以下文件
```
/stopwords.txt 停用词表
```
请将原始数据放于下面目录中, 请确保都是utf-8编码格式
```
/rawdata/
01_arc_s_95598_wkst_train.tsv
01_arc_s_95598_wkst_test.tsv
02_s_comm_rec.tsv
09_arc_a_rcvbl_flow.tsv
09_arc_a_rcvbl_flow_test.tsv
train_label.csv
test_to_predict.csv
```
其余目录作用
```
/code/ 用于存放程序代码
/myfeatures/ 用于存放程序运行生成的各种特征文件
/result/ 用于存放最终的输出结果
```
### 2.运行
确认以上文件存在之后,依次运行:
```
python code/create_features_A.py # 生成低敏感度用户的特征文件
python code/select_features_A.py # 采用xgboost对低敏感度用户的文本特征进行筛选
python code/model_A.py # 训练低敏感度用户的预测模型,及模型融合
python code/create_features_B.py # 生成高敏感度用户的特征文件
python code/select_features_B.py # 采用xgboost对高敏感度用户的文本特征进行筛选
python code/model_B.py # 训练高敏感度用户的预测模型,及模型融合
```
### 3.输出文件说明
程序输出的结果包括`特征文件`和最终`预测结果`两部分:
```
myfeatures/
statistical_features_1.pkl 低敏感度用户的统计特征
text_features_1.pkl 低敏感度用户在表1中的ACCEPT_CONTENT文本信息
single_select_words.pkl 低敏感度用户部分,采用xgboost选择的文本特征
statistical_features_2.pkl 高敏感度用户的统计特征
text_features_2.pkl 高敏感度用户在表1中的ACCEPT_CONTENT文本信息
multi_select_words.pkl 高敏感度用户部分,采用xgboost选择的文本特征
result/
A.csv 低敏感度用户中的电费敏感用户
B.csv 高敏感度用户中的电费敏感用户
result.csv 合并结果
```
## 其他
如果觉得不错的话,欢迎大家点击右上角star,谢谢!
我们参加的其他竞赛:
[2nd Place Solution for SMP CUP 2016](https://github.com/liyumeng/SmpCup2016)
[2016CCF 大数据精准营销中搜狗用户画像挖掘 final winner solution](https://github.com/hengchao0248/ccf2016_sougou)
![](others/banner.jpg)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的竞赛项目学习资料,作为参考学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 CCF大数据竞赛 客户画像赛题(用户画像)源码+学习说明.zip
资源推荐
资源详情
资源评论
收起资源包目录
CCF大数据竞赛 客户画像赛题(用户画像)源码+学习说明.zip (11个子文件)
code_20105
others
banner.jpg 51KB
readme.md 3KB
客户画像比赛解决方案.pdf 753KB
rawdata
README.md 35B
stopwords.txt 3KB
code
create_features_B.py 23KB
model_A.py 4KB
model_B.py 4KB
select_features_A.py 3KB
create_features_A.py 16KB
select_features_B.py 3KB
共 11 条
- 1
资源评论
土豆片片
- 粉丝: 1555
- 资源: 5641
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功