1
1 XML 的诞生
---- 首先,让我们来回顾一下可扩展置标语言 XML(eXtensible Markup Language)的发展
简史。
----XML 有两个先驱--SGML 和 HTML,这两个语言都是非常成功的置标语言,但是它们都在
某些方面存在着与生俱来的缺陷。SGML(Standard Generalized Markup Language)的全
称是标准通用置标语言,它为语法置标提供了异常强大的工具,同时具有极好的扩展性,因
此在分类和索引数据中非常有用。但是,SGML 非常复杂,并且价格昂贵,几个主要的浏览
器厂商都明确拒绝支持 SGML,使 SGML 在网上传播遇到了很大障碍。
----相反,超文本置标语言 HTML(HyperText Markup Language)免费、简单,在世界范围
内得到了广泛的应用。它侧重于主页表现形式的描述,大大丰富了主页的视觉、听觉效果,
为推动 WWW 的蓬勃发展、推动信息和知识的网上交流发挥了不可取代的作用。可是,HTML
也有如下几个致命的弱点,这些弱点逐渐成为 HTML 继续发展应用的障碍。
• HTML 是专门为描述主页的表现形式而设计的,它疏于对信息语义及其内部结构的
描述,不能适应日益增多的信息检索要求和存档要求。
• HTML 对表现形式的描述能力实际上也还非常不够,它无法描述矢量图形、科技符
号和一些其他的特殊显示效果。
• HTML 的标记集日益臃肿,而其松散的语法要求使得文档结构混乱而缺乏条理,导
致浏览器的设计越来越复杂,降低了浏览的时间效率与空间效率。
----正因为如此,1996 年人们开始致力于描述一个置标语言,它既具有 SGML 的强大功能和
可扩展性,同时又具有 HTML 的简单性。XML 就是这样诞生的。
----正象 SGML 和 HTML 一样,可扩展置标语言 XML 也是一种置标语言,它通过在数据中加
入附加信息的方式来描述结构化数据。不过,XML 并非象 HTML 那样,只提供一组事先已
经定义好的标记。准确地说,它是一种元置标语言,允许程序开发人员根据它所提供的规则,
制定各种各样的置标语言。在 XML 中,置标的语法是通过文档类型定义 DTD(Document
Type Definition)来描述的,也就是说,通过 DTD 来描述什么是有效的标记,并进一步定
义置标语言的结构。除了定义置标的语法外,为了明确各个标记的含义,XML 还使用与之
相连的样式单(style sheet)来向应用程序,比如浏览器,提供如何处理显示的指示说明。
一言以蔽之,XML 是通过数据文档、DTD、样式单三个分离的部分来描述数据的。
----虽然 XML 貌似复杂,但它有一些突出的优点:
----1. 良好的可扩展性。XML 允许各个不同的行业根据自己独特的需要制定自己的一套标
记,同时,它并不要求所有浏览器都能处理这成千上万个标记,同样也不要求一个置标语言
能够适合各个行业各个领域的应用,这种具体问题具体分析的方法更有助于置标语言的发
展。
评论0