![](https://csdnimg.cn/release/download_crawler_static/86208636/bg1.jpg)
对大数据时代档案管理的思考
郭雪萍
摘要:本文在概述大数据的特点、原理与流程的基础上,分析了大数据给档案管理带
来的机遇与挑战,重点提出了大数据时代档案管理的应对策略。
Abstract:
On the basis of summarizing the characteristics, principles and processes of
big data, this article analyzes the opportunities and challenges brought by
big data to archive management, and puts forward the strategies for archive
management in the era of big data.
关键词:大数据;档案管理;机遇;挑战
1 大数据概述
1.1 大数据的特点
大数据主要有四个方面特点:一是数据量巨大,二是数据的种类繁多,三是价值密度
相对低,四是处理速度特别的快。概括起来即为四个“V”:大量(Volume)、多样
(Variety)、价值(Value)、高速(Velocity)。
1.2 大数据的原理与流程
大数据的原理是运用云计算处理和其数据库、云存储、虚拟化的主要技术手段,对海
量数据开展数据挖掘,从而快速获得有价值的信息。其核心价值在于对海量数据进行存储
和分析。
大数据涉及的流程包括:
①数据采集:采用多个数据库来接收来自数据采集终端的数据。
②导入处理:将数据采集终端的数据导入到一个集中的大型分布式数据库或者分布式
存储集群,每秒导入量一般达百兆甚至千兆以上。
③统计分析:用分布式数据库,或分布式集群对存储其内的海量数据进行统计分析后
进行分类汇总。