摘要:随着科学技术的不断发展,对海洋测绘的手段需要不断改变,传统的技
术不再适应现在的需要,同时海洋环境越来越复杂化就使得传统的采集数据模式
和存储空间能力都不符合现阶段的发展,最为重要的是其处理技术很难达到测绘
数据的要求;其中,用 Hadoop 作为例子,其大数据技术是目前解决海洋测绘问
题较好的技术,但是其数据的准确仍有待提升,需要不断创新海洋测绘技术
关键词:海洋;测绘;数据分析
当我们对海洋资源进行开发的时候,需要及时根据测绘出来的海洋环境变化
情况进行记录,详细记录细节可以有效帮助采集海洋测绘数据对其进行存储以及
后期处理工作。当前我国致力于建立一个全方位立体化的精准海洋测绘系统,以
海洋测绘数据达到到 PB 级别为目标,突破传统的 GB 模式。
现阶段应用最为广泛同时比较成熟的大数据技术就是 Hadoop,此外还有
Hbase、Hive 等一些技术[1]。Hadoop 是一个分布计算的平台,主要是 HDFS 文件
系统和 MapReduce 计算框架这两个部分;首先,HDFS 是一个并行的文件系统,
其拥有较高的扩展性、容错性也达到一定高度,可以用于测量中。同时可以把众
多低廉的机器进行重新组织作为一个分布式的系统,用来储存数据以及对海量数
据进行管理。但是因其是一个分布式的文件系统所以极其容易扩展,对海量海洋
测绘数据的存储也不需要把数据都存放在一整个集中式的服务器上,而是可以对
其进行分散保存,置于不同的节点上。HDFS 的主要优势就是用来保存海量数据的,
所以通常用来处理 TB 或者是 PB 级别的数据。MapReduce 这个并行计算模型是
Hadoop 的核心部件,一般情况下利用计算机自身拥有的运算处理能力来解决一
些复杂的技术操作。HBase 是一个分布式 NoSQL 数据库,它和传统建立的关系型
数据库有一些不同之处就是, HBase 在设计的开始就以可以处理大量数据为目标。
处理数据的能力最大限度可以高达 10 亿行;HBase 进行海量数据的存储时需要与
HDFS 文件系统相结合才可以。HBase 中的数据展现出来的是稀疏的、多维度的映
射表,并且它的行关键字以及列关键字是充当索引的工具,所有的数据模式都是
字符串类型。Hive 是根据 HDFS 文件系统的数据进行仓库框架补充,其主要的配
备和功能就是:ETL 工具、数据存储管理系统以及关于大型数据集查询等;查询
系统主要是利用类似 SQL 的 HiveQL 完成的。Hive 可以提供命令行及图形界面这
两种不同的用户接口。
进行海洋测绘时需要考虑多种情况。因为海洋测绘数据的信息繁多,不但要
考虑水温、盐的成分多少以及深度等基本水文的信息,也要考虑地理信息、生物
信息以及遥感信息等。所有的不同因素的数据都各有特点,当处理这些信息的时
候需要注意它们的处理需求和存储格式[2]。对海量的海洋测绘数据进行系统的分
析后可以得出海洋测绘数据的特点有几方面:(1)海量。对海洋测绘的过程会
有许多的监测点,它们收集到的数据结构十分复杂,并且处在动态变化的过程中,
这就使得测绘的数据值会处在增长的状态,所以当出现这样的情况仅仅使用本地
存储是不能满足海量数据的存储的要求。(2)数据采集及模型存在差异。测绘
的结构不同就会使得测绘数据的记录格式随之变化,存储结构也随之不同,造成
评论0
最新资源