下载
第1章 O r a c l e 与 X M L
扩展标记语言( X M L )是一种元标记语言。就像在广域网协会( World Wide We b
C o n s o r t i u m ,W 3 C)的XML 1.0规范中所说明的, X M L 可以让用户定义自己的标记语言,从而
可以在X M L 文件中描述并封装数据。这些文件可以在类似于 Netscape Navigator或M i c r o s o f t
Internet Explorer的浏览器中显示,并通过因特网在应用之间或业务之间交换,存储到数据库中
或从数据库中取出。X M L具有简单性,它是开放标准的一部分,加入了用户自定义的标记。
X M L 起源于通用标记语言( Standard Generalized Markup Language,S G M L),后者于1 9 8 6
年由国际标准化组织( International Standards Org a n i z a t i o n,I S O )批准,基于通用标记语言的
超文本标记语言( Hypertext Markup Language,H T M L)诞生于1 9 9 0年。虽然在文档世界中
S G M L 仍然是广为使用的标准,而 H T M L 作为广域网上数以百万计的 We b页面的基础依然用途广
泛,但X M L 正在获得广泛的接受,因为它与现有的标记语言相比,在数据的交换、存储、描述
等方面都具有优点。自从 W 3 C在1 9 9 8年2月出版XML 1.0版的规范以来,在相当广泛的范围内,
许多人都认为它将成为电子商务在语言和数据交换方面的选择。
1.1 XML基本概念和术语
类似于所有的标准, X M L也有数不清的概念和技术术语需要解释。由于开发 X M L是用来传
送数据的,因此,介绍一个例子,看一下标准的数据库中书籍列表的数据记录。一个复杂的
S Q L查询典型情况下将会返回下述格式的数据:
如果X M L 用作输出表单,则该记录的每个数据项都将具有附加的上下文环境,如下所示:
本例中某些值得注意的项将在稍后进行探讨。可以注意到文件具有对称性,且每个数据块
都被其上下文所包围,形式类似于< c o n t e x t > . . . < / c o n t e x t > 。尖括弧及其内部的文字称为标记(t a g),
每组标记及其包围的数据称为元素。这种关系可以认为类似于数据库中表的一列,其中标记的
文字相当于列标题,标记之间的文字相当于该列中某一行的数据。在前一例中, t i t l e 应该是列名,