没有合适的资源?快使用搜索试试~ 我知道了~
资源详情
资源评论
资源推荐

集团大数据平台
整体方案建议书
1

2

目 录
1 项目概述.................................................................................................................................... 12
1.1 建设背景....................................................................................................................................12
1.1.1
集团已有基础
.......................................................................................................................12
1.1.2
痛点及需提升的能力
...........................................................................................................12
1.1.3
大数据趋势
...........................................................................................................................12
1.2 建设目标....................................................................................................................................13
1.2.1
总体目标
...............................................................................................................................13
1.2.2
分阶段建设目标
...................................................................................................................14
1.3 与相关系统的关系....................................................................................................................14
1.3.1
数据分析综合服务平台
.......................................................................................................14
1.3.2
量收系统
...............................................................................................................................15
1.3.3
金融大数据平台
...................................................................................................................15
1.3.4
各生产系统
...........................................................................................................................15
1.3.5 CRM.......................................................................................................................................15
1.4 公司介绍和优势特点.................................................................................................................16
1.4.1 IDEADATA...............................................................................................................................16
1.4.2 TRANSWARP..........................................................................................................................17
1.4.3
我们的优势
...........................................................................................................................18
2 业务需求分析............................................................................................................................. 20
2.1 总体需求....................................................................................................................................20
2.2 数据管理....................................................................................................................................21
2.2.1
数据采集
...............................................................................................................................21
2.2.2
数据交换
...............................................................................................................................22
2.2.3
数据存储与管理
...................................................................................................................22
2.2.4
数据加工清洗
.......................................................................................................................23
2.2.5
数据查询计算
.......................................................................................................................23
2.3 数据管控.......................................................................................................................................23
2.4 数据分析与挖掘........................................................................................................................24
3

2.5 数据展现....................................................................................................................................25
2.6 量收系统功能迁移....................................................................................................................25
3 系统架构设计............................................................................................................................. 26
3.1 总体设计目标............................................................................................................................ 26
3.2 总体设计原则............................................................................................................................ 26
3.3 案例分析建议............................................................................................................................ 27
3.3.1
中国联通大数据平台
...........................................................................................................27
3.3.2
恒丰银行大数据平台
...........................................................................................................33
3.3.3
华通
CDN
运营商海量日志采集分析系统
..........................................................................43
3.3.4
案例总结
...............................................................................................................................47
3.4 系统总体架构设计....................................................................................................................47
3.4.1
总体技术框架
.......................................................................................................................47
3.4.2
系统总体逻辑结构
...............................................................................................................51
3.4.3
平台组件关系
.......................................................................................................................53
3.4.4
系统接口设计
.......................................................................................................................57
3.4.5
系统网络结构
.......................................................................................................................60
4 系统功能设计............................................................................................................................. 62
4.1 概述............................................................................................................................................ 62
4.2 平台管理功能............................................................................................................................ 63
4.2.1
多应用管理
...........................................................................................................................63
4.2.2
多租户管理
...........................................................................................................................65
4.2.3
统一运维监控
.......................................................................................................................66
4.2.4
作业调度管理
.......................................................................................................................84
4.3 数据管理....................................................................................................................................85
4.3.1
数据管理框架
.......................................................................................................................85
4.3.2
数据采集
...............................................................................................................................88
4.3.3
数据交换
...............................................................................................................................90
4.3.4
数据存储与管理
...................................................................................................................91
4.3.5
数据加工清洗
.....................................................................................................................105
4

4.3.6
数据计算
.............................................................................................................................106
4.3.7
数据查询
.............................................................................................................................119
4.4 数据管控..................................................................................................................................131
4.4.1
主数据管理
.........................................................................................................................131
4.4.2
元数据管理技术
.................................................................................................................133
4.4.3
数据质量
.............................................................................................................................136
6)数据清理............................................................................................................................... 137
4.5 数据 ETL....................................................................................................................................141
4.6 数据分析与挖掘......................................................................................................................143
4.6.1
数据分析流程
.....................................................................................................................145
4.6.2 R
语言开发环境与接口
......................................................................................................146
4.6.3
并行化
R
算法支持
.............................................................................................................146
4.6.4
可视化
R
软件包
.................................................................................................................149
4.6.5
编程语言支持
.....................................................................................................................151
4.6.6
自然语言处理和文本挖掘
.................................................................................................151
4.6.7
实时分析
.............................................................................................................................152
4.6.8
分析管理
.............................................................................................................................152
4.6.9
分析支持
.............................................................................................................................155
4.6.10
指标维护
...........................................................................................................................156
4.6.11
分析流程固化
...................................................................................................................156
4.6.12
分析结果发布
...................................................................................................................156
4.6.13
环境支持
...........................................................................................................................156
4.7 数据展现..................................................................................................................................157
4.7.1
交互式报表
.........................................................................................................................158
4.7.2
仪表盘
.................................................................................................................................163
4.7.3
即席查询
.............................................................................................................................164
4.7.4
内存分析
.............................................................................................................................165
4.7.5
移动分析
.............................................................................................................................165
4.7.6
电子地图支持
.....................................................................................................................166
5 技术要求实现........................................................................................................................... 168
5
剩余63页未读,继续阅读








cicade
- 粉丝: 12
- 资源: 25
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


安全验证
文档复制为VIP权益,开通VIP直接复制

评论17