通信与网络中的浅谈网格数据传输和服务通信与网络中的浅谈网格数据传输和服务
网格数据是计算机中以栅格结构存贮的内部数据。是扫描式数字化仪的直接产物,适用于屏幕显示和行式打印
输出。在网格数据中,把研究范围分成大小均匀的格网矩阵。存贮的信息可以是点、线、面实体,也可以是指
向该单元有关属性的指针。格网越小,精度越高, 但存贮量越大。因格网是有规则排列的,故实体的坐标位置
可隐含在格网的存储地址中。网格数据便于数据处理、区域综合分析和评价。与矢量数据相比,其软件设计较
简单,缺点是数据存储量大,特别是稀疏的空间数据,要浪费许多存储单元。适用于数字地形模型,遥感图像
等信息的存储。 从图1可以看到,数据管理的重要地位,不仅在处理海量数据的数据网格,在数据管理尤其
是数据传输更是占
网格数据是计算机中以栅格结构存贮的内部数据。是扫描式数字化仪的直接产物,适用于屏幕显示和行式打印输出。在网
格数据中,把研究范围分成大小均匀的格网矩阵。存贮的信息可以是点、线、面实体,也可以是指向该单元有关属性的指针。
格网越小,精度越高, 但存贮量越大。因格网是有规则排列的,故实体的坐标位置可隐含在格网的存储地址中。网格数据便
于数据处理、区域综合分析和评价。与矢量数据相比,其软件设计较简单,缺点是数据存储量大,特别是稀疏的空间数据,要
浪费许多存储单元。适用于数字地形模型,遥感图像等信息的存储。
从图1可以看到,数据管理的重要地位,不仅在处理海量数据的数据网格,在数据管理尤其是数据传输更是占据着不可撼
动的位置,而且它在计算网格和服务网格等领域也是至关重要的,数据以高效、可靠、方便地移动和复制关系到整个系统的效
率。
数据管理的主要功能包括:数据的访问和控制,数据的拷贝和管理,以及与计算、网络和存储的协同调度。这些软件或服
务相辅相成,构成了网格中不可或缺的数据管理部分。
2 数据传输数据传输——GridFTP协议协议
数据传输(data transmission)就是依照适当的规程,经过一条或多条链路,在数据源和数据宿之间传送数据的过程。也
表示借助信道上的信号将数据从一处送往另一处的操作。
在模拟和传感器技术发展的推动下,数据集规模已经增长到TB数量级,而且PB级的数据量将很快问世。位于日内瓦的欧
洲粒子研究中心(CERN),目前正负电子对撞机(LEP)每年的数据是0.2~0.3TB,而几年内建成的紧凑μ介子螺线管(CMS)每年
所产生的数据就将达到几个PB。网格中现有的存储系统如数量存储系统、高性能存储系统(DPSS、HPSS等)侧重于实现快速
传送存储设备和并行机或群聚计算机之间的庞大文件;而分布式文件系统(DFS)则侧重于支持海量存储与负载平衡,而这些
系统间并不兼容。
访问、分析和处理分布在不同逻辑位置、存储系统上的数据,应用程序要么选择只支持某些存储系统,要么使用多种方法
来获取不同存储系统上的数据。若能提供一种在异构系统上的公共互用层将对存储和用户双方都非常有利,因此一个普通的、
但扩展性强的数据传输协议呼之欲出。这样的机制比建立一个分层的客户端或网关要好得多,可以避免性能上的损失和过大的
复杂性。
Globus提出了GridFTP协议,该协议不仅拥有现今使用的数据传输协议的特点,还易于扩展,支持更多的存储系统。
GridFTP基于FTP协议(因为FTP是最为广泛和实用的IETF标准协议),又有多个RFC标准定义了FTP及其扩展,而且其中一些
在网格环境中特别适用。下面将讨论并比较当前Internet和网格中依然存在的各种数据传输协议,并介绍Globus中GridFTP协
议的实现和编程接口。
2.1 协议比较协议比较
(1)FTP 是File Transfer Protocol(文件传输协议)的英文简称,而中文简称为“文传协议”。用于Internet上的控制文件的双
向传输。同时,它也是一个应用程序(Application)。用户可以通过它把自己的PC机与世界各地所有运行FTP协议的服务器
相连,访问服务器上的大量程序和信息。FTP的主要作用,就是让用户连接上一个远程计算机(这些计算机上运行着FTP服务
器程序)察看远程计算机有哪些文件,然后把文件从远程计算机上拷到本地计算机,或把本地计算机的文件送到远程计算机
去。