没有合适的资源?快使用搜索试试~ 我知道了~
——维度分析:统计各种维度下的留存用户数、留存用户比例8. 沉默用户分析概念:一段时间内(连续7天)没有使用过app的用户思路:比如,现在运算的是20号的报表,
资源详情
资源评论
资源推荐
1. 项目背景
网站、app 的运营者需要知道自己的产品或服务的运营状况,就需要对使用自己产品的用户
进行各种角度的数据分析,比如:
用户数量
新增用户
留存用户
活跃用户
地域分析
渠道分析
.......
要做这样的分析,数据来源应该是用户的产品使用的行为日志,行为日志是由 app 或者网站
的页面获取用户相关信息后,发送给后台服务器记录下来的:
2. 项目开发--模块 1(数据预处理)
需求:
1、检查每条日志的必选字段是否完整,不完整的日志应该滤除
(
cid_sn ;
mobile_data_type
os_ver
mac ;
resolution
commit_time ;
sdk_ver ;
device_id_type ;
city ;
device_model ;
android_id
carrier
promotion_channel
app_ver_name ;
imei ;
app_ver_code ;
pid
net_type
device_id ;
app_device_id
release_channel ; ## 用户下载该 app 时所用的 app 应用市场:360,安智市场,
country ;
time_zone ;
os_name ; ## 操作系统名称
manufacture ## 手机生产厂家
commit_id ; ## 提交请求的序号
account ## 账号
app_token ; ## app 名称:
app_id ; ## app 的 id 标识(所属的公司事业部)
language ; ## 用户的操作系统语言()
build_num
)
2、为每条日志添加一个用户唯一标识字段:user_id
user_id 的取值逻辑:
如果是 ios 设备,user_id=device_id
如果是 android 设备, user_id = android_id
如果 android_id 为空,则 user_id = device_id
3、将 event 字段抛弃,将 header 中的各字段解析成普通文本行
主要技术点:json 解析 gson/fastjson/jackson/......
公司有一个变态需求:
需要将清洗后的结果数据,分 ios 和 android 和其他 三种类别,输出到 3 个不同的文
件夹;
剩余11页未读,继续阅读
臭人鹏
- 粉丝: 20
- 资源: 330
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0