【企业级大数据平台的建设背景】
随着大数据技术的飞速发展,企业开始尝试利用分布式架构,如MPP数据库(大规模并行处理)、Hadoop、流处理等技术,以应对日益增长的数据处理需求。浙江移动在内部进行了这些技术的试点,取得了初步成效。然而,由于缺乏整体规划和统一的技术策略,出现了平台重复建设、数据冗余、质量问题,以及MPP数据库兼容性、Hadoop版本不统一、人力资源不足等问题。这些问题严重阻碍了大数据的有效应用,因此构建统一的企业级大数据平台显得尤为紧迫。
【企业级大数据平台建设规划】
企业级大数据平台的目标是实现“数据整合、能力共享、应用创新”。通过数据资产化的统一管理,实现各业务域数据的整合,包括B域(业务域)、O域(运营域)、M域(管理域)以及其他数据源,如互联网数据和IoT数据。数据采集将分为离线采集、实时采集和互联网采集,确保数据全面。平台将基于Hadoop构建云化数据处理架构,统一汇聚各域数据,形成融合的统一数据模型。同时,通过数据建模,实现数据标准化和一致性,提高数据可用性。此外,还将进行组织管理转型,组建专门的模型设计开发团队,强化数据核心能力。
【数据资产管理】
以资产的视角管理数据,构建企业数据资产目录、分类体系和部署架构,定期盘点,实现数据资产的可查、可视、可用。建立常态化的数据运营管理机制,快速响应数据变化。通过数据资产管理平台,实现数据引入、处理、发布、稽核及修正的平台化管理,提升大数据资产应用效率,实现数据资产化。
【能力开放与应用】
平台开放数据能力,提供用户轨迹信息、用户行为属性等服务,支持精准广告、地理位置服务、用户标签服务等。同时,开放应用服务,如用户信用监测、人流监控、应用数据分析等,为企业内外部提供数据产品和服务。通过SaaS、AaaS、DaaS等模式,将数据能力转化为商业价值。
【解决思路】
面对建设过程中遇到的问题,企业应制定统一的技术演进策略,消除数据孤岛,优化数据质量,统一Hadoop版本,解决兼容性问题。通过增强团队能力,合理分配资源,提高数据处理效率。建立数据标准化流程,确保数据一致性,简化数据交互。加强数据安全管理和合规性,推动数据开放共享,促进业务创新和数字化服务的发展。
综上,企业大数据平台的建设是一个涉及数据整合、资产管理和能力开放的综合工程,需要从整体规划、技术选型、数据治理、团队建设等多个方面进行考量和实施,以充分发挥大数据的潜力,为企业创造更大的价值。