EMC 中国移动数据产品
知识点一:EMC公司概况 EMC是全球领先的IT行业公司,成立于1979年,并于1996年进入中国。截至2010年,EMC的市值为417亿美元,而其子公司VMware市值为300亿美元。EMC在全球拥有4万名员工,其中中国员工人数为2500人。此外,EMC拥有100亿美元的现金储备。EMC不断创新,拥有超过15000项专利技术,并在研发上的投入持续增加,从2006年的10亿美元增长至2010年的18亿美元。 知识点二:EMC技术与产品创新 EMC持续融入创新技术,涉及信息安全、内容管理、虚拟化、数据移动服务、资源管理、可用性、归档和云计算等领域。在云计算方面,EMC提供公共云服务,并展示了从2003年到2010年的发展趋势。 知识点三:GREENPLUM技术特性 GREENPLUM是EMC旗下的一款数据仓库产品,具备大规模并行处理(MPP)架构,用于处理大数据分析需求。GREENPLUM的基本架构由Master节点、Network Interconnect和Segment节点组成。Master节点负责生成查询计划并派发,Segment节点则执行查询计划及数据存储管理,支持外部数据源的并行装载或导出,并提供SQL和MapReduce接口。 知识点四:数据分布与处理 数据均匀分布是并行处理的关键。GREENPLUM支持通过哈希分布和随机分布来管理数据分布。哈希分布按照指定列的哈希值分配记录到不同的Segment节点,保证相同哈希值的记录总是在同一个节点上。随机分布则随机分配记录到各个Segment节点,不保证相同值的数据在同一个节点上。此外,分区表可以减少查询时的数据搜索范围,提高查询性能,分区数据自动分布到各个节点。 知识点五:索引、列数据库与数据压缩 GREENPLUM支持多种索引类型,包括B-tree、Bitmap、R-tree、Hash和GIST。它还支持按列存储的数据库以及列数据库索引,有助于提高查询效率。在数据压缩方面,GREENPLUM提供了透明的实时数据压缩技术,支持gzip压缩级别1到9和QuickLZ压缩级别1。 知识点六:负载管理技术 文档提到了GREENPLUM的负载管理技术,但具体内容未在提供的文档片段中详细描述。负载管理技术通常关注于优化数据库性能,确保在高负载条件下数据库仍能高效运行。 知识点七:数据仓库测试建议 文档中提及了数据仓库测试建议,但未给出具体建议内容。通常,在数据仓库测试中,建议包括测试数据仓库的设计、加载数据的效率、查询性能、系统稳定性和备份恢复等方面。 知识点八:EMC服务和价格组成 文档提到了GREENPLUM服务和价格组成,但具体信息未在片段中展示。一般来说,服务和价格组成可能包括软件许可费用、实施服务费、培训费以及后续的维护支持费用。 知识点九:市场发展趋势 文档提到了IT技术及市场发展趋势,但未给出具体的信息。通常在市场发展趋势中,会分析新兴技术和市场趋势对当前市场的影响,以及预测未来可能的发展方向。 注意:文档是2011年的方案文档,部分信息可能已经过时或发生了变化。
剩余54页未读,继续阅读
- 粉丝: 145
- 资源: 8
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助