大数据分析模型平台解决方案
数据源层:采集网站、Wap网站、App、应用系统等原始数据。
数据处理层:利用数据仓库、数据挖掘、数据流处理、数据实时处理等大数据技术进行数据运算、存储。
数据应用层:提供数据统计分析等功能。
在互联网环境与业务专网环境各部署一套网站大数据分析系统,分别采集分析互联网网站与业务专网网站的用户访问行为数据,按照税务行业信息系统安全保护要求,两套系统采用物理隔离。
网站用户行为数据的采集方法采用国际主流的网站数据采集技术,即页面标签采集法。通过在网站页面嵌入通用的JS代码,实现相关数据的采集,采集类型包括PC网站、Wap网站、App(Android、IOS)。
用户兴趣模型构建和个性化推送是基于用户画像获取的用户特征,实现个性化内容推荐。
用户画像是基于用户属性信息与用户行为信息共同描绘出用户总体轮廓,随着用户属性信息的丰富及用户行为数据的积累,用户属性信息库与用户行为信息库不断迭代更新,使用户画像逐步完善、清晰。
个性化推送可针对用户的实时访问进行内容推送。个性化推送应不依赖于CMS系统,网站、WAP站点、APP可通过直接调用数据接口获取推送内容