## 用户画像系统
> 参考书籍:《用户画像:方法论与工程化解决方案》 https://github.com/HunterChao/User-Portrait
用户画像建模就是对用户“打标签”,有三种类型;
- 统计类:性别、年龄、近7天活跃时长、活跃天数等
- 规则类:比如“消费活跃”用户的口径定义为“近30天交易次数>2”(运营人员和数据人员共同协商确定)
- 机器学习数据挖掘类:比如购买商品偏好、用户流失意向等(成本高,一般这类标签占比较少)
![image](images/用户画像数仓架构.png)
用户画像模块建设
![image](images/用户画像主要覆盖模块.jpg)
![image](images/用户画像建设项目流程.jpg)
![image](images/用户画像项目各阶段关键产出.jpg)
### 案例:图书电商
商城的运营目标:
- 兼顾自身商业目标的同时更好的满足消费者的需求,通过推荐系统提高点击率等
- 建立用户流失预警机制,及时级别将要流失的用户群体,采用运营策略挽回用户
表:
- 用户信息表 dim.user_basic_info
- 商品订单表 dw.order_info_fact
- 埋点日志表 ods.page_event_log
- 访问日志表 ods.page_view_log
- 商品评价表 dw.book_comment
- 搜索日志表 dw.app_search_log
- 用户收藏表 dw.book_collection_df
- 购物车信息表 dw.shopping_cart_df
用户画像表结构设计
- 全量数据表:每个日期分区都存储当天全量数据
- 增量数据表:每个日期分区存储当天被打上标签的用户
- 宽表设计:
- 用户属性宽表
- 用户日活跃宽表
### 数据标签体系(关键环节):
1.划分方式:
- 按五种维度划分
- 用户属性维度
- 年龄、性别、安装时间、注册状态、城市
- 活跃登录地、历史购买状态、历史购买金额
- 用户行为维度
- 订单相关行为、访问行为
- 近30天行为类型指标(比如活跃多少天)、高频率活跃时间段、点击偏好、营销敏感度等
- 用户消费维度
- 浏览品类
- 近7天加购类
- 近7天收藏类
- 近7天购买类
- 风险控制维度
- 账号风险
- 设备风险
- 借贷风险
- 社交属性维度
- 常登录地、上午、中午、下午
- 单身、有小孩、市场销售、公务员
- 按应用场景划分
![image](images/画像标签应用场景划分.jpg)
2.标签命名方式
- 规范: 标签主题_用户维度_标签类型_一级归类
- 标签主题
- 人口属性 ATTRITUBE
- 行为属性 ACTION
- 用户消费 CONSUME
- 风险控制 RISKMANAGE
- 用户维度:标签打在用户user_id上还是设备cookieid上(可用U、C等字母标识)
- 标签类型:统计类、规则类、算法类
- 一级标签:可以再不断的细化下去
```
比如:
标签男: ATTRITUBE_U_01_001
标签女: ATTRITUBE_U_01_002
01表示一级分类
001和002是该一级标签下的标签明细
```
### 用户画像产品化
- 即席查询
- 标签视图与标签查询
![image](images/平台标签视图.jpg)
![image](images/标签元数据视图.jpg)
![用户标签查询](images/用户标签查询.jpg)
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
java+大数据项目实战.zip (197个子文件)
mvnw.cmd 6KB
nginx.conf 3KB
file-flume-kafka.conf 1KB
.gitignore 1KB
.gitignore 333B
maven-wrapper.jar 50KB
UserVisitSessionAnalyseSpark.java 51KB
AppMain.java 23KB
TableProcessFunction.java 7KB
MockData.java 7KB
BaseLogApp.java 6KB
CarDescisionParser.java 5KB
MavenWrapperDownloader.java 5KB
DateUtils.java 5KB
SessionAggrStat.java 5KB
JDBCHelper.java 5KB
BaseDBApp.java 4KB
DataSourceUtil.java 3KB
AppBase.java 3KB
ValidUtils.java 3KB
CategorySortKey.java 3KB
DimSinkFunction.java 3KB
CustomerDeserialization.java 3KB
CustomerDeserialization.java 3KB
JdbcUtil.java 3KB
AppNewsDetail.java 2KB
DimUtil.java 2KB
SessionDetail.java 2KB
StringUtils.java 2KB
SessionDetailImpl.java 2KB
Constants.java 2KB
Utils.java 2KB
MyKafkaUtil.java 2KB
AppLoading.java 2KB
SessionArrgStatAccumulator.java 2KB
TableProcess.java 2KB
Task.java 2KB
AppStart.java 2KB
AppComment.java 2KB
JDBCHelperTest.java 2KB
MergeArrayVariablesAggrUDF.java 2KB
LogETLInterceptor.java 2KB
FlinkCDC.java 2KB
TaskDAOImpl.java 2KB
SessionAggrStatDAOImpl.java 2KB
LogTypeInterceptor.java 1KB
ConfigurationManager.java 1KB
ParamUtils.java 1KB
FlinkCDCWithCustomerDeserialization.java 1KB
AppAd.java 1KB
AppDisplay.java 1KB
SparkUtils.java 1KB
LoggerController.java 1KB
RedisUtil.java 1KB
SessionRandomExtract.java 1KB
JDBCCRUDTest.java 1KB
AppPraise.java 1009B
AppNotification.java 1006B
Singleton.java 994B
Top10Category.java 976B
LogUtils.java 888B
ConfigurationManager.java 867B
SessionRandomExtractImpl.java 846B
PageOneStepConvertRateSpark.java 784B
AppFavorites.java 774B
DAOFactory.java 764B
Top10CategoryDAOImpl.java 757B
Top10Session.java 743B
Top10SessionDAOImpl.java 686B
DFSchemaInfo.java 662B
GmallConfig.java 612B
AppActive_foreground.java 532B
AppErrorLog.java 518B
LogQuickstartApp.java 491B
HBaseSparkQuery.java 480B
ExecutorThreadPool.java 472B
NumberUtils.java 444B
AppActive_background.java 361B
ShopLoggerApplication.java 337B
ConfigurationTest.java 326B
UtilTest.java 320B
TaskDAOTest.java 312B
ParseJsonData.java 303B
AppTest.java 285B
AppTest.java 285B
ISessionDetailDAO.java 240B
ShopLoggerApplicationTests.java 229B
UtilsTest.java 224B
ITop10SessionDAO.java 223B
ISessionRandomExtractDAO.java 186B
App.java 176B
ISessionAggrStatDAO.java 165B
ITop10CategoryDAO.java 158B
ITaskDAO.java 158B
用户画像项目各阶段关键产出.jpg 416KB
用户属性维度标签2.jpg 311KB
用户属性宽表设计.jpg 307KB
用户属性维度标签1.jpg 239KB
风险控制维度标签.jpg 220KB
用户消费维度标签设计.jpg 180KB
共 197 条
- 1
- 2
资源评论
- winvalid2023-10-04资源质量不错,和资源描述一致,内容详细,对我很有用。
- AmineTony2023-10-18资源很赞,希望多一些这类资源。
GeekyGuru
- 粉丝: 1788
- 资源: 1099
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功