滴滴公司在构建其敏捷数据中台的过程中,旨在通过精益生产和敏捷创新的方法,优化数据处理和利用,从而提高业务效率和数据资产的价值。数据中台的建立旨在解决传统数据体系中存在的问题,如业务烟囱、创新乏力、计算存储能力不足、数据文化薄弱、数据质量问题以及高投入低产出等。
在滴滴的数据体系中,数据被看作是重要的资产,通过数据平民化、服务化和智能化实现资产变现。数据资产化的过程包括打破数据孤岛,整合资产,确保安全合规,并通过量化、标准化和优化进行治理。信息数据化则强调从记录结果转向记录过程,从副产品转变为精密设计,从决策支撑演进为数据驱动业务。
滴滴的精益数据管理体系着重于提供高价值、高可靠、高效率且低成本的数据服务。这涉及到了数据生产价值链的分级、监控、复盘和自动化,以及敏捷数据创新的实施,如用结果导向、自配置、模仿做和自助化。数据创新价值线则关注于满足多场景、全链路的复杂需求,以及多团队、多目标的协作。
为了实现这一目标,滴滴建立了智能数据目录,以支持发现、理解和信任数据,促进协作和众包。同时,数据治理方面注重数据资产、安全合规和服务驱动,全面量化并重点攻克难点。数据文化的培养也至关重要,通过持续改进和尊重人的作用来推动数据系统的进步。
滴滴的数据基础设施包括数据系统工具链,涵盖了数据开发、测试、发布、质量监控、告警、运维等环节。数据采集涵盖了实时、批处理和Binlog等多种方式,使用了如Flink、Water、Druid等实时计算框架,以及Hadoop、Hive、Spark等批处理工具。在数据存储上,使用了HBase、Presto、Clickhouse等技术,构建了数据图谱和数据字典,以支持数据的自助查询和API服务。
此外,滴滴的数据赋能工具DataRank通过评估资产价值、归属和优化方向,帮助业务部门更好地利用数据。数据建设方面,滴滴实现了数据全链路的分级保障和治理,通过DataHub等工具确保数据的稳定性和效率。数据服务不仅覆盖了业务分析、运营分析、产品优化、营销服务、流程优化和财务管控,还提供了CXO仪表盘,以实现全方位、全链路的能力覆盖。
通过这些措施,滴滴成功地提高了数据基础质量,加快了数据开发效率,优化了数据使用流程,并建立了数据治理的标准化体系。例如,核心数据产出时间提前至早上5点,开发效率提升了35%,数据开放率达到了99.04%,并且实现了隐私数据的全脱敏和完备的权限管控,确保了数据安全零事故。
总结来说,滴滴的敏捷数据中台实践是通过精益管理和敏捷创新相结合,构建了一个高效、智能且安全的数据生态系统,以推动业务发展,优化决策,提高数据资产的变现效率。这一实践对于其他寻求提升数据价值的企业具有重要的参考意义。