您好,登錄后才能下訂單哦!
小編給大家分享一下XML與HTML的示例分析,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
首先,XML與HTML類似的,都是一種標記語言。
當初在設計XML時,并非為了將HTML趕下神壇,實際上,XML是為了另外一種目的設計的。
XML旨在傳輸信息,HTML旨在顯示信息
HTML可以有什么標簽,不能有什么標簽,是被一系列規范http://www.php.cn/code/12132.html" target="_blank">約束的;
但在XML中,可以定義自己的標簽。
由于XML是純文本格式的,因此獨立于任何硬件和軟件,是一種真正的跨平臺數據傳輸格式。
在XML的基礎上,許多其它的技術也得以誕生,比如我們最熟悉的web service,WSDL機制便是基于XML來實現的(也有基于JSON實現的)。
這都得益于XML是一種擴展性非常高的數據傳輸格式。
必須有關閉標簽
如<a>,則必須有一個對應的與之配對,當然用<a name=""/>則是一種簡略的縮寫。
大小寫敏感
XML文檔必須有根元素
屬性值必須加引號
特殊字符的轉義
< - < > - > & - & ' - ' " - "
注釋
<!-- this is a comment -->
名稱可以含字母、數字以及其他的字符
名稱不能以數字或者標點符號開始
名稱不能以字符 “xml”(或者 XML、Xml)開始
名稱不能包含空格
屬性必須加引號,如果屬性本身有雙引號,就用單引號包圍它
<a name='steve "aplple" Jobs' />
有許多驗證方式來驗證XML格式是否良好。常用的有以下兩種:
XML DTD
XML Schema
合法的 XML 文檔是“形式良好”的 XML 文檔,同樣遵守文檔類型定義 (DTD) 的語法規則:
<?xml version="1.0" encoding="ISO-8859-1"?> <!DOCTYPE note SYSTEM "Note.dtd"> <note> <to>George</to> <from>John</from> <heading>Reminder</heading> <body>Don't forget the meeting!</body> </note>
在上例中,DOCTYPE 聲明是對外部 DTD 文件的引用。下面的段落展示了這個文件的內容。
<!DOCTYPE note [ <!ELEMENT note (to,from,heading,body)> <!ELEMENT to (#PCDATA)> <!ELEMENT from (#PCDATA)> <!ELEMENT heading (#PCDATA)> <!ELEMENT body (#PCDATA)> ]>
W3C 支持一種基于 XML 的 DTD 代替者,它名為 XML Schema:
<xs:element name="note"> <xs:complexType> <xs:sequence> <xs:element name="to" type="xs:string"/> <xs:element name="from" type="xs:string"/> <xs:element name="heading" type="xs:string"/> <xs:element name="body" type="xs:string"/> </xs:sequence> </xs:complexType> </xs:element>
命名空間的主要目的是解決元素命名沖突的問題。以下兩份XML配置文件有命名沖突的問題:
<table> <tr> <td>Apples</td> <td>Bananas</td> </tr> </table>
<table> <name>African Coffee Table</name> <width>80</width> <length>120</length> </table>
使用命名空間來解決沖突后:
<table xmlns="http://www.w3.org/TR/html4/"> <tr> <td>Apples</td> <td>Bananas</td> </tr> </table>
<table xmlns="http://www.w3school.com.cn/furniture"> <name>African Coffee Table</name> <width>80</width> <length>120</length> </table>
命名空間xmlns屬性值本身并沒有多大含義,只是為了區分命名空間的不同,但實際上xmlns會被開發者用來標識某些資源。
所有 XML 文檔中的文本均會被解析器解析。
只有 CDATA 區段(CDATA section)中的文本會被解析器忽略。
PCDATA 指的是被解析的字符數據(Parsed Character Data)。
XML 解析器通常會解析 XML 文檔中所有的文本。
當某個 XML 元素被解析時,其標簽之間的文本也會被解析:
<message>此文本也會被解析</message>
解析器之所以這么做是因為 XML 元素可包含其他元素,就像這個例子中,其中的 <name> 元素包含著另外的兩個元素(first 和 last):
<name><first>Bill</first><last>Gates</last></name>
而解析器會把它分解為像這樣的子元素:
<name> <first>Bill</first> <last>Gates</last> </name>
術語 CDATA 指的是不應由 XML 解析器進行解析的文本數據(Unparsed Character Data)。
在 XML 元素中,"<" 和 "&" 是非法的。
"<" 會產生錯誤,因為解析器會把該字符解釋為新元素的開始。
"&" 也會產生錯誤,因為解析器會把該字符解釋為字符實體的開始。
某些文本,比如 JavaScript 代碼,包含大量 "<" 或 "&" 字符。為了避免錯誤,可以將腳本代碼定義為 CDATA。
CDATA 部分中的所有內容都會被解析器忽略。
CDATA 部分由 "<![CDATA[" 開始,由 "]]>" 結束:
<script> <![CDATA[ function matchwo(a,b) { if (a < b && a < 0) then { return 1; } else { return 0; } } ]]> </script>
在上面的例子中,解析器會忽略 CDATA 部分中的所有內容。
關于 CDATA 部分的注釋:
CDATA 部分不能包含字符串 "]]>"。也不允許嵌套的 CDATA 部分。
標記 CDATA 部分結尾的 "]]>" 不能包含空格或折行。
以上是“XML與HTML的示例分析”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。