XML
上课老师经常会提到xml,上网查了查,好像xml跟html差不多,可是还是比较模糊,请高手说一下到底什么是xml,xml有哪些方面的应用?谢谢! 我和楼主WY同学一样,我也只知道XML的名字而已,扩展可标记语言(Extentsible Markup Language),是用来定义其它语言的一种元语言,其前身是SGML(标准通用标记语言)。它没有标签集(tag set),也没有语法规则(grammatical rule),但 是它有句法规则(syntax rule)。任何XML文档对任何类型的应用以及正确 的解析都必须是良构的(well-formed),即每一个打开的标签都必须有匹配的结束标签,不得含有次序颠倒的标签,并且在语句构成上应符合技术规范的要求。 XML文档可以是有效的(valid),但并非一定要求有效。所谓有效文档是指其符合其文档类型定义(DTD)的文档。如果一个文档符合一个模式(schema)的规定 ,那么这个文档是"模式有效的(schema valid)"具体含义是什么,真的是一点都不知道sdlkfj8 。在工作中具体可以实现哪些用处。
请高手指点一下。 XML实际上是Web上表示结构化信息的一种标准文本格式,它没有复杂的语法和包罗万象的数据定义。XML同HTML一样,都来自SGML(标准通用标记语言)。SGML是一种在Web发明之前就早已存在的用标记来描述文档资料的通用语言。但SGML十分庞大且难于学习和使用。鉴于此,人们提出了HTML语言。但近年来,随着Web应用的不断深入,HTML在需求广泛的应用中已显得捉襟见肘,有人建议直接使用SGML作为Web语言。但SGML太庞大了,学用两难尚且不说,就是全面实现SGML的浏览器也非常困难。于是Web标准化组织W3C建议使用一种精简的SGML版本——XML。XML与SGML一样,是一个用来定义其他语言的元语言。与SGML相比,XML规范不到SGML规范的1/10,简单易懂,是一门既无标签集也无语法的新一代标记语言.
XML是用来存放数据的;
XML不是HTML的替代品,XML和HTML是两种不同用途的语言。
XML是被设计用来描述数据的,重点是:什么是数据,如何存放数据。
HTML是被设计用来显示数据的,重点是:显示数据以及如何显示数据更好上面。
HTML是与显示信息相关的, XML则是与描述信息相关的。 谢谢楼上两位指点,现在对xml的定义和应用有了更加清晰的概念了~
[ 本帖最后由 candy_83 于 2007-6-25 11:29 编辑 ] XML文档结构和语法是XML 1.0规范的元语言标准。它是XML技术的基础。
2.1.1 XML文档结构
一个格式良好的XML文档由三个部分组成(如图2.1)。
(1)一个可选的序言(prolog)。
(2)文档的主体(body):有一个或多个元素组成,其形式为一个可能包含字符数据(character data)的层次树。
(3)可选的尾声(epilog):其内容包括注释,处理指(processing instruction,PI)和紧跟树后面的空白。
2.1.2语法概要
1.XML文档的序言组成:
(1)一个可选的XML声明。
下面的例子是一个XML声明。
<?xml version ="1.0" encoding ="UTF-8" standalone="yes"?>
其中version="1.0"表示文档遵循XML 1.0规范;Encoding ="UTF-8"表示文档用UTF-8的字符编码;Standalone ="yes"表示所有必需的实体的声明都包含在文档中。
(2) XML声明后面可能是几个注释、处理指令、空白字符。
(3)一个可选的文档类型声明:<!DOCTYFE…>。
(4)文档类型声明后面可能是几个注释、处理指令、空白字符。
2.文档的主体
文档的主体由元素构成。格式良好的XML文档的定义形式是一个简单的层次树,每个文档都有一个而且只有一个根节点,它被称为文档实体(Document Entity)或文档根(Document Root)。这个节点可能包含PI和注释,而且总是包含子元素树,子元素树的根称作文档元素(Document Element)。由于文档根和文档元素并不是一回事,所以最好不要把文档元素看作是“根元素”(即使它是子元素树的根)。两者之间的区别如图2-1所示:
图2-1文档根与文档元素区别
元素是XML标记的基本组成部分。它们可以包含其他的元素、字符数据、字符引用、实体引用、PI、注释和CDATA部分;这些一起被称作元素内容(Element Content)。所有的XML的内容都必须包容在它的元素中。元素使用标记(tag)进行分隔,有一对尖括号“<>”围住元素类型名(一个字符串)。每个元素都必须有一个起始标记和一个结束标记分隔开,这项规则唯一的例外是没有任何内容的元素即空元素((Empty Element),它既可以使用起始标记/结束标记对,也可以使用短小精悍的混合形式即空元素标记。下面列举几种元素:
文本元素:<author>Evelyn Waugh< /author >
空元素: <author></author>或<author/>
嵌套元素:<name>
<firstname>liu</firstname>
<lastname>liu</lastname>
</name>
混合元素:<languages>
motherlanguage
<language>Chinese</language>
difficult
<language>English</language>
<languages>
注意:XML对元素有一种非常重要的要求即它们必须正确的嵌套。
3.可选的尾声(epilog)
文档的尾声一般是空的。留给以后扩展用的。
我是应届毕业生,这个是我的毕业论文 部分关于XML的资料 ,我做的 论文就是<XML于关系数据库的存储与查询》 我们从XML产生的背景和原因可知XML一开始设计时就吸收了SGML和HTML的优点并摒弃了SGML和HTML的缺点。XML以其良好的数据存储格式。可扩展性高度结构化。便于网络传递等优势将在许多领域一显身手。便于软件开发人员和内容创作者在网页上组织信息。不仅能满足不断增长的网络应用需求。而且还能够确保在通过网络进行交互合作时,具有良好的可靠性与互操作性。XML有如下的特性:
1.可扩展性
允许用户定义新的标签的功能。HTML被定义成一套固定的标签集是HTML最大的弱点。HTML不允许用户根据在Web上表达一些特殊需要去定义专用的标签或属性,因此很多比较特殊或专门格式的文件采用现有的HTML语言是无法处理的。例如音乐乐谱。化学方程式,数学公式,财务报表以及工程应用等等。它们都有其专门的表达方式。浏览器厂商为了弥补标准HTML的不足而定义了一些自己的专用标签。但是各个厂商定义的专用标签是互不兼容必然带来混乱的局面。而XML最重要的特性就是可扩展性,即允许用户定义自己的标签以及这些标签携带相关参数的属性和值。因此运用XML可以满足HTML无法处理的特殊的资料表达需要。
2.结构化
HTML不支持表达数据库结构或面向对象的分级结构所需要的深层结构,XML至少是结构化的。在结构化信息的组成要素中DTD(Document Type Definition文件类型定义)或XML Schema是一个很重要的组成部分。它规定了资料的格式规范并且用这种规范来对资料进行解释。XML自带一个XML语法分析器。语法分析器使用DTD或Schema来确定一个文件是否是有效的或结构化的。结构化信息的优点是允许不同格式的资料可以相互交换。是用户可以使用结构化XML文件作为一种中介体实现两种数据库之间进行灵活的转换。
3.自描述性
XML的另一个重要的特性就是允许自描述信息。尽管并不要求XML文件必须是自描述的(只要求结构化的)。但带有自描述信息可以增强Web的检索功能。这些描述被称为“元资料”,它们可以包括有关一个文件的信息安全(谁可以阅读它,阅读的范围),文件内容,文件使用什么语言写的,作者是谁以及关于这个文件的其它任何信息。XML语言已经创建了很多种不同的元资料格式包括RDF(Resource Description Format资源描述格式),CDF(Channel Data Format信息资料格式),PICS(Platform for Internet Content Selection,Internet内容选择平台),WIDL(Web Interface Definition Language ,Web接口定义语言)等等。
4.交互性
据W3C的XML工作组的主席Jon Bosak称:用户需要同Web上的应用交互操作,以及这种通过HTML很难实现的交互就是为什么XML需要存在的重要的原因。XML支持交互性,用户可以自己制订和设计应用XML的文件格式,而不必须在使用固定的HTML格式,能得到比HTML更丰富的语法和更多的功能。
5.语义性强
XML可以自行设计有意义的标记便于异构系统之间的数据交换和信息检索。实现机器预计器之间的信息交换。
6.纯文本
几乎任何工具都可以创建和编辑XML,使得程序可以更简单读写它。从而提供了从小配置文件到企业级数据仓库的可扩展性。
7.可格式化
可扩展样式语言XSL可以指定如何显示数据。数据和显示分离。可以为同一数据指定不同的样式表用于不同输出。
8.很强的连接能力
XLink可以定义双向连接,多目标连接,扩展连接和两个文档之间连接。
9.与平台无关
XML对格式的定义严格,具有层次结构而且与厂商无关。即XML文档可无须任何更改直接移植到其他平台上。 楼上专业对口了 正需要学习下,5楼的描述很详细啊,辛苦了
[ 本帖最后由 yoyo_zhang 于 2007-6-27 14:15 编辑 ] “可扩展标记语言”(XML) 提供一种描述结构化数据的方法。与主要用于控制数据的显示和外观的 HTML 标记不同,XML 标记用于定义数据本身的结构和数据类型。
XML 使用一组标记来描绘数据元素。每个元素封装可能十分简单也可能十分复杂的数据。您可以定义一组无限制的 XML 标记。例如,您可以定义一些 XML 标记来声明订单中的数据,如价格、税收、发货地址、帐单地址等等。由于 XML 标记在整个单位中以及跨单位采用,因此来自各种不同数据存储区的数据将更容易交换和操作。
XML 是一种简单、与平台无关并被广泛采用的标准。XML 相对于 HTML 的优点是它将用户界面与结构化数据分隔开来。这种数据与显示的分离使得集成来自不同源的数据成为可能。客户信息、订单、研究结果、帐单付款、病历、目录数据及其他信息都可以转换为 XML。XML 与 HTML
以下是要记住的有关 XML 与 HTML 之间关系的几个要点:
a.. XML 不是要替换 HTML;实际上 XML 可以视作对 HTML 的补充。XML 和 HTML 的目标不同:HTML 的设计目标是显示数据并集中于数据外观,而 XML 的设计目标是描述数据并集中于数据的内容。
b.. 与 HTML 相似,XML 不进行任何操作。虽然 XML 标记可用于描述订单之类的项的结构,但它不包含可用于发送或处理该订单以及确保按该订单交货的任何代码。其他人必须编写代码来实际对 XML 格式的数据执行这些操作。
c.. 与 HTML 不同,XML 标记由架构或文档的作者定义,并且是无限制的。HTML 标记则是预定义的;HTML 作者只能使用当前 HTML 标准所支持的标记。
XML 的使用
XML 是一种极灵活的、传递数据的方式。以下全部是可使用 XML 的场合的示例:
a.. 普通文档
b.. 结构化记录,如约会记录或订单
c.. 移动数据的 Internet/Intranet Web 应用程序
d.. 带有数据的对象,如对象或 ActiveX 控件的持久格式
e.. 数据记录,如查询的结果集
f.. Web 站点的元内容,如“信道定义格式”(CDF)
g.. 图形显示,如应用程序的用户界面
h.. Web 上信息与人的链接
i.. C# 代码(可以用 XML 形式);有关更多信息,请参见 XML 文档
j.. 用于定位可用 XML Web services 的发现文档;有关更多信息,请参见 XML Web services 发现。
以下列出存储信息时 XML 相对于其他格式的若干优越性:
a.. XML 格式是基于文本的,这使得它们更容易读、更便于记录,有时也更便于调试。
b.. XML 文档可使用已为 HTML 建立的很多基础结构,包括 HTTP 协议和某些浏览器。HTTP 允许穿过防火墙传输 XML。
c.. XML 分析已有完善的定义,且已广泛应用,使得在各种环境中从 XML 文档检索信息成为可能。
d.. 应用程序可依赖 XML 分析器进行某些结构验证以及数据类型检查(当使用架构时)。
e.. XML 建立在 Unicode 基础上,使得创建国际化文档更容易。不过,XML 并不适合于所有情况。XML 文档往往比它们替换的二进制格式详细。它们占用更多的网络带宽和存储空间,或需要更多的处理器时间进行压缩。XML 分析可能比分析高度优化的二进制格式慢,并且可能需要更多内存。然而,精心的应用程序设计能够
避免一些问题。
验证 XML 文档
若要验证 XML 文档包含所需数据和结构,必须将一个 XML 架构与 XML 文档相关联。XML 架构是定义如何构造元素和属性来形成 XML 文档的规则。您可以在单位之间共享架构,以使得传输和处理共享数据变得简单。有关更多信息,请参见 XML 架构介绍。
显示 XML 数据
有几种方式可用于显示(或提供)XML 数据。
还有数据绑定的机制可与样式表一起使用,以便以可视形式展示 XML 数据,以及添加交互性。
以下是显示 XML 的几种方法:
a.. XSLT — 可扩展样式表语言
b.. CSS — 级联样式表
c.. Microsoft Internet Explorer
页:
[1]