DMP大数据平台设计方案.pdf

所需积分/C币:48 2019-11-19 14:19:26 1.56MB PDF
330
收藏 收藏
举报

dmp大数据平台设计方案
争蕴布数 3/18 2.3数据管理 2.4数据分析功能…… a:::::·::::::: .:::a.:::::: 2.5应用中心… 18 争蕴布数 4/18 1.塔布平台体系架构 塔布数据致力于为企业提供专业的数据挖掘、管理、分析、经营的专业DMP平台。 我们通过长期的研发投入,积累了丰富的数据处理经验,研发出具有自有知识产权的 系列技术以适应数据市场的发展以满足不同行业、不同领域对于大数据平台的需求 最大幅度的提升数据对企业发展的价值,为企业的变革提供了强有力的基石。 11平台总览 1.1.1企业大数据应用金字塔 战略 战略分忻 ●战略分析与部智 数据产品化、可视化 门 客户个件化推荐8期管琿 精细化运营和营销 产品体验分析&口碑监 ●用户客户体验优化 金字塔体系R路径分析的数捐体系 部门 用户ID+用户画像+用户兴趣+用户行为 ●数据基础平台 争蕴布数 5/18 1.1.2数据增值与变现探索 企业数据源 数据增值 数据变现 第一方数据 用户属性 者洞察 线下CRM 企业网次 运营商 360 全融 用户关系 广告精准投放 平台对接 精准 第一方数据 用户画像 用户行为 /微言粒丝 个牡化服为 据示广告 用户超 数据融合 统 社会化营销 第三方数据 D体系 用户需求 塔布 手引西 箱、QQ号 第三方接入 用户价值 (数据合作 113塔布大数据平台体系结构 ①①①①① 数据应用 场分析 精佳 数驱动应用产生价值 洞察 销 优化 报务 数据→洞客÷胆名后量+黄-创向用 数据平台 大数据管理平台DMP Data Man agement Platform 把分散的数据作为资产来统一管理 服务 IDMP 通过数据的融台分析使数据增值 把拥力作为服务提供 计算平台 Hadoop as d Service Hadp结一资源池 服务 ) 对分散儿dg桌集群源统曾理 外供统一的计算和存德能力 数据资 接入 业数据 第三方数据 ->内外数合 字合个业据和等二内数据 对于DMP平台,塔布数据有科学强健的架构体系,引入多种員有自主产权的组件: 争蕴布数 6/18 Weibo Q说说运营商 移动应用 企业私有数据 单机导入 多机导入( Hadoop) ET 分布式调度平台 Buffalo Q MetaLabe(导入时打tag 标签推荐(备选tag) U E 分 R 层 Hornb语义分析(NER分类 Word2ec近义词联想 Tag词库 ElasticSearch 久 HBase analyze:合并数据 UserInfo用户信息 Content(溯源 aw:原始数据 get Users getcontent 114塔布大数据平台核心功能点 多数据源整合 全面受众分析 Data Integration Audience Analytics 帮助企业采集和同步内外部数据涼,有 支持对客户群的实时受众分析,基于自 效管理个数据资产,打浩属干企中的 有细分标答体系提供多维消害者洞架 基础教据管理平台 海量第三方数据扩展 投放管理/效果评估 Data Linkage Publish measure 塔布白有亿级鹑三方消费古数据库 提供对接利媒体和广告渠這,帮助 帮助企业打展对已有用广认知,支持 全业进行数据回收、效果评位和优化 潜客挖掘 客户画像和细分管理 企业应用开发支持 Tag Market Segmentation Open API 支持用户行为、内容、购物、轨迹四 提供亢善的开发接口,方便对接企业 大标签维度体系,30万+超细分标签 各种个性化数据应用需求 提供全面消费音视图 争蕴布数 7/18 1.15塔布丰富的三方数据来源 ID体系 手机号+IMEI+QQ号+微博号+邮箱地址+其他身份D 标签体系 个人属性 行为属性 位置属性 年龄/性别,行业职业网站AP新闻/视频 行为轨迹+地点 兴趣属性 购物属性 关系属性 商品/品牌/美食/影视图书商品库+商品识别/分类 和谁交往/关注谁 微博数据 QQ数据行业营销数据微信H5监测阿里妈妈 1亿+ 10亿+ 3亿 数据 数据合作 第三方合作伙伴数据 1亿+ 12塔布DMP平台关键技术 塔布大数据在数据的采集、存储、分析、应用各环节,特别在非结构化数据的语乂 计算上,积累了丰富的数据处理经验,研发出自有知识产权的一系列技术与核心组件 应用于全网数据采集、海量数据计算、高智能语义分析、精准的用户画像等多个功能点。 121全网数据采集 我们采用了先进的数据采集技术:包括分布式爬虫,具备可扩展性,配置了基于 Spark/ Redis实现实时数据抓取,数据具有时效性。采用内嵌代理IP服务,避兔网站 屏蔽,持续稳定抓取,并且内嵌自动数据抽取算法。系统攴持多租户/多实例模式。 122海量计算 塔布自主研发了海量计算平台— BUFFALO+OWML,支持复东的工作流调度以及 争蕴布数 8/18 任务优先级管理,我们支持以插件方式支持企业复杂的业务逻辑,并且兼容主流的分布 式计算框架( MapReduce/ Storm/ Spark系统隔离了底层的应用框架和上层应用逻 辑,将来易于技术升级。 123语义分析 塔布语义分析采用了具有自主研发的高智能语义分析组件Hornηbil,可以实现关 建词抽取、实体识别、内容分类、内容聚类、内容摘要、观点抽取等功能,在观点抽取, 我们具有三元组观点抽取专利:<对象,特征,情感>。 124用户画像 塔布数据通过长期多行业的积累,具备有丰富的标签体系,可以提供用户需求的 精准画像,采用深度学习的方法,提髙标签推荐的准确性,便于营销策划和挖掘标签关 系。支持对客户群实时受众分析,基于自有细分标签体系提供多维用户洞察. 2.塔布DMP平台主要功能点 塔布DMP平台主要功能包括:仪表盘、数据整合、数据管理、数据分析、效果监 测、应用中心、多租户管理等功能,本章会针对每个功能进行详细介绍。 平台为用户呈现的页面主要分为四个区域:LOGO区域、功能选择区域、主操作 区、租户管理区,如下图所示: 争蕴布数 9/18 LGD区域 xingkong 租户爸理区 O功能选区 主功区 企业数据资产 菊三方歎据资产 段用 后翌 本否问户数 李鼠跃用, 总用数 丰所成职 本跃用 技起合 2.404万 32 1130亿37.54亿33.18万 9675 用尸数 用产 1C7 MF.DD 554 99,244 ②③66 唱实 85№ 12280,20了 塔布 g58 布学动中社2 1合移 3.T0,B1 打化王 用产数她记录新通用产数 21仪表盘 仪表盘功能是向租户( owner)现当先数据总体情况的一个功能租户( owner) 通过仪表盘可以清楚地了解到自有数据情况,包括了解到当前的数据资产、数据用户增 量及当前数据用户的大致画像。 10/18 争描布据 xingkong 数据资产展示区域 企业用户 仪表盘 企业数据资产 第三方数据资产 总用户数 总记录数 本周新增用户数 本同活跃用户数 总记录数 李周新地用户数本活跃用户数 1027 2404万 100 11.30亿 3754亿乙 3318万 9675 用户数 星空商喊 10030% 1,cz7 85545 966,9C9244 ① 塔布营销数 109s% 122,8C827 塔布微博 19635,265 督布-动端数据2 15790.21 0.26%2 -移动端数据 0.1s 2.104.6b 时间变化曲线 总用户数总记录数新增用户数 0.075k 10/3 用广画像 用户画像区域 热门地区和年龄 特征人胖 典型用户 年密排行 网购党 2996% 影剧迷 29.8 旅游爱好者 8.5E% 影剧迷 上班族 25-29 广东 2.11数据资产展示 仪表盘的数据资产展示区域为租户( owner)展示了当前已有的数据资产,租户 owner河以看到当前企业已导入系统的数据资产及企业通过第三方渠道获取的数据

...展开详情
试读 18P DMP大数据平台设计方案.pdf
立即下载 身份认证后 购VIP低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
上传资源赚钱or赚积分
最新推荐
DMP大数据平台设计方案.pdf 48积分/C币 立即下载
1/18
DMP大数据平台设计方案.pdf第1页
DMP大数据平台设计方案.pdf第2页
DMP大数据平台设计方案.pdf第3页
DMP大数据平台设计方案.pdf第4页

试读结束, 可继续读2页

48积分/C币 立即下载