返回首页
当前位置: 主页 > 航空资料 > 计算机 >

XML高级编程上(4)

时间:2010-08-09 13:05来源:蓝天飞行翻译 作者:admin 点击:
  
容,H T M L和X M L的表达方法有何不同:
程序清单1 - 4
程序清单1 - 5
两个表单所描述的都是一个人的名字和年龄。在第一个用X M L实现的表单中,我们可以将
第1章XML 简介使用7 下载
其中的每一点内容与现实世界中的人的概念关联起来。我们界定出姓名的各个部分,我们知道
哪个是姓,哪个是名。只要我们了解到关于人的某些信息,数据的含义对于我们来说就非常清
楚了。相反,H T M L表单将数据格式化为一个表格,但是没有一个明确的方法能够说明我们处理
的内容是关于一个人的信息。其中的一点组织信息—年龄—也被作为内容而不是结构被隐
藏起来了。当我们阅读到这段内容时会正确地理解,但计算机是不会的,不管你告诉它多少有
关描述的规则也是如此。
X M L中的“扩展”一词指的是定义新的标记及其用途的标准机制。由于这一切均是标准化
的,所以我们拥有固定不变的途径来描述这些新标记并同其他X M L用户交流。对于我们在标记
中使用的属性来说,情况也是如此。最近大多数定义用于文档的X M L标记集的计划建议都是针
对元数据的—关于数据的数据—它们用来在特定的X M L文档族中交流标记结构的信息。不
仅我们的数据是自解释的,那些关于数据的数据同样也是自解释的。
现在让我们研究一下X M L标记在特定领域中的使用。
1.5 词汇表
我们曾经在前面暗示过, X M L最具特点的特性是它天生的扩展性。与其相比, H T M L开始
时只是一种简单的标记语言(带有固定的标记集),用于在I n t e r n e t上交流科技论文,但随着浏览
器的开发者不断添加新的标记和功能,这项技术迅速发展起来。在H T M L中增加的许多内容都是
多媒体传输功能和浮华的商业化We b页面。遗憾的是,这些标记都是各自公司半专用化的,如果
用在其他浏览器中经常会出现问题。在这当中,某些部分成为了H T M L的正式内容,但大多数都
是专用的。可惜的是,这些并没有在数据建模、语义标记或者结构化信息交换协议上为H T M L提
供多少帮助。
与此相比, X M L则一向致力于简便而快速地,根据企业、科学规范或者其他方面的需要来
构造定制的标记集。同时,每一个企业(甚至每一个人)都可以选择定义自己的X M L标记集,
X M L的一个好处就在于能够共享这类“词汇表”,它们都使用同样的基本语法、分析程序以及其
他工具。可共享的X M L词汇表不仅提供了更易于查询的文档和数据库,而且为在不同的组织和
计算机应用程序之间交换信息提供了一条途径。
X M L“词汇表”是对X M L数据的描述,作为信息交换的媒介,它经常是与人类在某种领
域(例如商业、化学、法律、音乐)的活动息息相关的。
你可以在h t t p : / / w w w. o a s i s - o p e n . o rg / c o v e r /找到Robin Cover的文章“The SGML/XML We b
Page”,这是一篇非常出色的、关于XML词汇表开发的参考文献。
下面,我们就很快地浏览一下目前比较重要的X M L词汇表,但并不深入到其语法细节。
1.5.1 科学词汇表
第一个应用X M L的是Peter Murray-Rust 的“ J U M B O”浏览器,主要用于化学标记语言
(Chemical Markup Language,C M L)(参见h t t p : / / w w w. x m l - c m l . o rg)。C M L曾经被称作“分子
H T M L”,但C M L还可以进行不同种类的文件格式的转化(不造成任何语义上的改变),并能够
8使用XML 高级编程
下载
创建适合于专业出版的结构化文档(参见图1 - 3)。
图1-3
科学的基础语言是数学, X M L词汇表中也有一种M a t h M L,它为数学表达式的转化提供了一
条途径。M a t h M L会用纯粹的图片以及(或者)粗糙的A S C I I码来代替各类方程式,以便在适当
的浏览器中准确地显示出来,并为代数、几何、统计及其他数学软件工具的符号提供交换格式。
(要了解M a t h M L的有关信息,可以访问h t t p : / / w w w. w 3 . o rg / M a t h /。)
其他科学类的词汇表还包括生命信息序列标记语言( Bioinformatic Sequence Markup
L a n g u a g e , B S M L ),用于基因序列和映射所产生的大量信息(参见h t t p : / / w w w .
v i s u a l g e n o m i c s . c o m / b s m l / i n d e x . h t m l);N A S A用于控制实验室仪器的仪器标记语言( I n s t r u m e n t
Markup Language,I M L)和它的一种实例天文仪器标记语言( Astronomical Instrument Markup
L a n g u a g e,A I M L)—参见h t t p : / / p i o n e e r. g s f c . n a s a . g o v / p u b l i c / a i m l /。这些M L都是X M L词汇表在
结构化技术文档、传播科学和技术信息方面的经典应用。此外, X M L的这类用途也为开发强大的
教育类工具提供了坚实的基础。
1.5.2 商业词汇表
商业是计算机应用得最为广泛的一个领域。世界金融活动的大量信息使用各种各样的格式
在计算机网络中进行传递。大多数的这类数据格式都是专用的;要真正全面地了解国际货币转
账的协议几乎是不可想象的!但是,财政和商务信息确实需要在企业之间进行交换,而这些信
息将会因通用信息标准而受益匪浅。
第1章XML 简介使用9 下载
商务活动既交换产品也交换货币,我们通常把这类活动叫做交易。这类交易经常会牵涉到
交换纸面上的正式法律文书。通常,这些文书可以使用电子数据交换( Electronic Data
I n t e r c h a n g e,E D I)标准进行电子交换。E D I定义了一种是大多数商务活动基础的格式,它适用
于许多商家对商家的交易。北美地区E D I的起源可以追溯到7 0年代早期的运输数据统筹委员会
(Transportation Data Coordinating Committee,T D C C)。9 0年代前期, A N S I发布了X 1 2标准(即
为大家所熟知的“ ASC X12”)。美国地区所进行的这类标准的开发受非盈利组织数据交换标准
协会(Data Interchange Standards Association,D I S A)的监督。
 
中国航空网 www.aero.cn
民航翻译 www.aviation.cn
本文链接地址:XML高级编程上(4)
 
------分隔线----------------------------