首页 > 代码库 > dom4j解析XML文件(1)—XML文件的基本常识

dom4j解析XML文件(1)—XML文件的基本常识

 1 <?xml version="1.0" encoding="UTF-8"?> 2 <list> 3     <emp id="1"> 4         <name>张三</name> 5         <age>34</age> 6         <gender></gender> 7         <salary>3000</salary> 8     </emp> 9     <emp id="2">10         <name>李四</name>11         <age>21</age>12         <gender></gender>13         <salary>4000</salary>14     </emp>15     <emp id="3">16         <name>王五</name>17         <age>46</age>18         <gender></gender>19         <salary>6500</salary>20     </emp>21     <emp id="4">22         <name>赵六</name>23         <age>28</age>24         <gender></gender>25         <salary>4400</salary>26     </emp>        27     <emp id="5">28         <name>钱七</name>29         <age>53</age>30         <gender></gender>31         <salary>12000</salary>32     </emp>    33 </list>

1.XML处理指令

  XML处理指令,简称PI(processing instruction)。

  处理指令是用来指挥解析引擎如何解析XML文档内容。

  例如:<?xml version="1.0" encoding="UTF-8"?>

2.元素和属性

  元素是从开始标签到结束标签的部分。元素可以包括其他元素、文本、或者两者的混合物。元素可以拥有属性。

  元素可以在开始标签中包括属性,属性(Attribute)提供关于元素的额外(附加)的信息。属性通常提供不属于数据组成部分的信息,但是对需要处理这个元素的应用程序来说很重要。

  元素必须加引号,双引号和单引号都可以。例如:<emp id="1">

3.实体引用

  实体引用可以是常用的短语,键盘字符,文件,数据库记录或者任何包含数据的项。在XML中,有时实体内包含一些字符,这些字符需要转移,见下面的对应关系。

  &lt;  <(小于)

  &gt;  >(大于)

  &amp;  &(与字符)

  &apos;  ‘(单引号)

  &quot;  "(双引号)

4.CDATA段

  格式:<![CDATA[文本内容]]>

  

dom4j解析XML文件(1)—XML文件的基本常识