基于云计算的海量数据存储模型
针对目前网络产生的数据越来越多以及随之而来的海量数据的存储问题,在云计算技术上,依据Hadoop 及虚 拟化技术,提出了基于云计算的海量数据存储模型。将医院信息化的海量数据部署在Hadoop 平台上,根据云计算的核心算法 MapReduce 来处理数据,最后将数据存储在虚拟资源池中。通过实际的应用,该模型可以很好地克服现行的存储方式存在的 不足,解决海量数据在存储当中存在的问题,并且能够很好地提高存储的效率。
针对目前网络产生的数据越来越多以及随之而来的海量数据的存储问题,在云计算技术上,依据Hadoop 及虚 拟化技术,提出了基于云计算的海量数据存储模型。将医院信息化的海量数据部署在Hadoop 平台上,根据云计算的核心算法 MapReduce 来处理数据,最后将数据存储在虚拟资源池中。通过实际的应用,该模型可以很好地克服现行的存储方式存在的 不足,解决海量数据在存储当中存在的问题,并且能够很好地提高存储的效率。
Hadoop 是一个由Java 语言实现的软件框架,在一个计算机集群中对海量数据进行分布式计算,这个集群可 以支持上千个节点和PB 级别的数据. HDFS 是专门为Hadoop 设计的分布式文件系统,作为Hadoop 最基本的构成元 素,保证内容的完整性与可用性. 但是HDFS 的操作界面并不友好,必须通过命令行或者IDE 插件来实现对文件的操 作. 在研究HDFS 的架构的基础上,设计实现了基于WEB 的HDFS 可视化文件访问系统.