没有合适的资源?快使用搜索试试~ 我知道了~
资源详情
资源评论
资源推荐
第 3 页 共 22 页
移动设备数据集分析
摘要:如今单纯的软件或硬件已经不被市场看好。想要卖出软硬件必须构建相
应的生态链而软硬件是构成一个系统或者一个品牌生态链最重要的两大部分。硬
件开发者针对当前最受欢迎的 app 继而推出相关高性能硬件。以及 app 设计者如
何根具热门机型推出该机型优化策略已经成为软硬件厂商需要思考的问题。其中
对 app 使用者年龄性别预测,app 地区活跃度,时段活跃度,对于 app 团队如何
针对特定人群特定时段设计优化起着非常重要的作用。这些关系这个 app 的生命
周期。以下详细介绍了基于移动设备数据构建的性别年龄预测模型,以及热门机
型,热门 app 统计,相关地区 app 使用活跃度,活跃时段等。
关键词:移动设备数据集;热门 app;热门硬件;性别年龄预测
第 4 页 共 22 页
目 录
一、数据分析目标与任务
…………………………………………
1.1 …………………………………………………………………..1
1.2……………………………………………………………………
二、数据预处理
…………………………………………………
2.1 …………………………………………………………………..
2.2……………………………………………………………………
三、数据探索
…………………………………………………
3.1 …………………………………………………………………..
3.2……………………………………………………………………
四、数据分析模型
…………………………………………………
4.1 …………………………………………………………………..
4.2……………………………………………………………………
五、方案评估
…………………………………………………
第 5 页 共 22 页
一、数据分析目标与任务
目标:实现对给定的移动设备数据集分析。预测使用者性别年龄。
任务:1、统计最多使用的手机品牌以及最受欢迎型号。
2、统计 app 最活跃日期及当前使用量。
3、统计 app 最活跃时间段及每个时间段使用情况。
4、分析 app 最活跃地区及该地区范围使用量情况。
5、将使用量最高的 app 统计显示其类别。
6、建立性别年龄预测模型并检验其准确率。
该实验用 python 编写在 pycharm 平台编译,运行于 x86/64Windows 平台
二、数据预处理
1.
数据说明(说明数据规模、数据文件、以及各字段等基本信息,并给出数据
样本和样本说明。)
数据集名称
gender_age_train.csv
数据规模
(row*colum)
74645*4
各字段基本息
device_id:仪器 id,用于标识移动设备。
Gender:性别
Age:年龄
Group:记录性别年龄并划分在相应组别
数据样本
device_id
gender
age
group
8076087639492060000
M
35
M32-38
样本说明
设备 id:-8076087639492060000
使用者性别:男
第 6 页 共 22 页
年龄:35
组别划分:男 32-38 岁
数据集名称
gender_age_test.csv
数据规模
(row*colum)
112072*1
各字段基本息
device_id:仪器 id,用于标识移动设备。
数据样本
device_id
1002079943728930000
样本说明
设备 id: 1002079943728930000
数据集名称
events.csv
数据规模
(row*colum)
3252950*5
各字段基本息
event_id:事件 id
device_id:设备 id
timestamp:时间戳-记录访问时间
longitude:经度
latitude:维度
数据样本
event_id
device_i
d
timestamp
longitude
latitud
e
1
2.92E+16
2016/5/1
0:55
121.38
31.24
样本说明
事件 id:
1
设备 id:29182687948017100
访问时间:2016/5/1 0:55
经度:121.38
纬度:31.24
数据集名称
app_labels.csv
数据规模
(row*colum)
459943*2
剩余19页未读,继续阅读
大头蚊香蛙
- 粉丝: 16
- 资源: 317
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0