数据表单名称 数据概况
数据缺失
率
是否使
用
01 95598工单信息 包含全部训练集和测试集,
核心数据
0 是
02 客户通话信息记
录
包含训练集用户656641个,测试集用户
369560个
0.29% 是
03 催办督办信息 包含训练集用户2757个,测试集用户355个 99.69% 否
04 用电客户信息表 包含训练集用户656282个,测试集用户
134325个
23.18% 否
05 用户电价信息表 包含训练集用户291857个,测试集0个 71.64% 否
06 低保户信息表 包含训练集用户2455个,测试集用户1505个 99.61% 否
07 费控用户信息表 包含训练集用户22192个,测试集用户10954
个
96.77% 否
08 实收电费信息表 包含训练集用户282152个,测试集用户
311222个
42.34% 否
09 应收电费信息表 包含训练集用户555748个,测试集用户
201702个
26.40% 是
10 运行电能表示数 - - 否
11 运行电能信息表 包含训练集用户641159个,测试集用户0个 37.70% 否
12 收费记录 包含训练集用户431833个,测试集用户
222635个
36.41% 否
2.3.项目总体思路
首先,我们分析核心数据95598工单信息发现,每个用户拥有的工单记录数量在[1,114]之
间,并且随着工单记录数量的增加,对应的用户数量越来越少。
x轴代表工单记录次数,y轴代表对应的用户数量(取log)
评论0