关于网络集群存储的文献读书报告
1.引言
大量数据资料应用的持续 快速增长,如仿真、建模、Internet 和 Intranet 浏览、多媒体、
交互进程、电子商务、资料仓库和数据采集等,导致了对更大的存储设备容量的需求,同时,
网络带宽的需求也在持续增加。然而,随着网络技术的不断发展和建设,巨大的网络客户使
传统的文件服务器成为网络服务的瓶颈,尤其在数据存储方面,不仅数据存储容量成指数增
长,而且对存储设备的性能、可扩展性、安全性及可管理性等诸多方面有进一步的要求。在
庞大的存储市场需求的推动下,存储技术也从传统的以主机为中心的存储结构向网络存储系
统发展。在网络存储技术中,由网络存储设备提供网络信息系统的信息存取和共享服务,其
主要特征体现在超大存储容量、大数据传输率以及高的系统可用性、远程备份、异地容灾等
方面。目前,网络存储技术正在成为计算机领域的热点,可以说,网络存储将引发继 CPU、
Intemet 之后 IT 领域的第三次技术浪潮。
后面所介绍的五篇论文,都是关于网络集群存储的模型的设计,并解决了上面所提出的
一些问题。
2.网络存储
2.1 传统存储与网络存储
在传统的存储结构中,存储子系统是附属于主机的,它一般由磁盘阵列、光盘库、磁带
库等组成大容量的存储空间,通过并行I/0通道与主机相连, 然后经网络接口与LAN、WAN
或MAN连接起来,这就象建立了一个数据传输的管道,数据从网络送到主机内存,接着送
人到存储子系统。反之,则从存储子系统到主机内存,接着送人到网络。可以看出,在这种
方式下,能否正常访问存储的数据主要依靠服务器的可用性及网络的数据流量。这种基于网
络的存储系统一般采用TCP/IP或SCSI协议。并且,远程用户在发送数据包时也不得不忍受
IJAN服务器和通过TCP/IP网络所带来的大的时间延迟。另外,网络和SCSI总线都不能实现
容错功能,如果一个SCSI驱动器或一个LAN的连接导致服务器出错,或者SCSI服务器需要
维护,这时,用户将不能进行数据存取访问,因此,服务器-磁盘这种存储方案正逐渐被网
络存储所替代。
目前,用于网络的存储主要有四种:附属于服务器的磁盘阵列(RAID)、集中式磁盘阵
列服务器、附网存储(NAS)和存储区域网(SAN)。前两种已经使用多年,但其可用性、可扩
展性、资料备份和资料迁移等方面的缺陷,已经越来越难以满足存储市场的需求。而NAS和
SAN则是近些年来发展起来的新的存储结构,并逐渐成为市场的新热点,尤其是SAN,已经
进入企业级存储领域,正在成为大网站、大企业信息系统的最佳存储方案
[1]
。
2.2 SAN 存储局域网技术
SAN是Storage Area Network的缩写
[2]
,即存储区域网络,是将采用光纤通道(Fibre
Channe1)技术,通过光缆通道交换机连接存储阵列和服务器主机,建立专用于数据存储的区
域网络。SAN经过十多年历史的发展,已经相当成熟,成为业界的事实标准(但各个厂商的
光纤交
换技术不完全相同,其服务器和SAN存储有兼容性的要求)。SAN使用的典型协议组是
SCSI和Fibre ChanneI(SCSI-FCP) Fibre Channel特别适合这项应用,原因在于一方面它可以传
输大块数据(这点类似于SCSI),另一方面它能够实现远距离传输(这点又与SCSI不同)
[3]
。
SAN是一种专门用于存储的联网存储基础设施环境,旨在提供—个可扩展、可靠的IT基
础设施。SAN通常由两部分组成:存储系统和一个逻辑上独立的网络。存储系统包括磁盘存