首页 > 代码库 > xml元素类型PCDATA和CDATA的区别(DTD中)
xml元素类型PCDATA和CDATA的区别(DTD中)
PCDATA
PCDATA 的意思是被解析的字符数据(parsed character data)。可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。PCDATA 是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。文本中的标签会被当作标记来处理,而实体会被展开。不过,被解析的字符数据不应当包含任何 & < > 字符;需要使用 & < > 实体来分别替换它们。
CDATA
CDATA 的意思是字符数据(character data)。CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。
几个实体引用字符:
< <
> >
& &
" "
' ‘
又有网上有人这样说,我觉得挺直观,先转过来:
PCDATA表示已解析的字符数据。
CDATA是不通过解析器进行解析的文本,文本中的标签不被看作标记。CDATA表示里面是什么数据XML不会解析,比如
- <![CDATA[
- if(a>b){
- System.out.println(a);
- }
- ]]>
注意上面的a与b之间的 > 符号.
PCDATA的数据是要给xml解析器去解析的,那上面的>去解析肯定会出错了,所以要用实体定义。上面的数据如果用PCDATA表示应该如下:
- if(a>b){
- System.out.println(a);
- }
CDATA是在XML文档里面使用的关键字,用来告诉浏览器,这部分内容不用解析,是给其他程序用的,比如js代码等。CDATA 部分由 "<![CDATA[" 开始,由 "]]>" 结束:
- <script>
- <![CDATA[
- function matchwo(a,b){
- if (a < b && a < 0){
- return 1;
- }
- else{
- return 0;
- }
- }
- ]]>
- </script>
#PCDATA是在 XML约束文档里使用的,如DTD类型的约束文档,在这里面表示元素的内容或属性的取值范围等等,是字符串形式的
- <?xml version="1.0"?>
- <!DOCTYPE note [
- <!ELEMENT note (to,from,heading,body)>
- <!ELEMENT to (#PCDATA)>
- <!ELEMENT from (#PCDATA)>
- <!ELEMENT heading (#PCDATA)>
- <!ELEMENT body (#PCDATA)>
- ]>
- <note>
- <to>George</to>
- <from>John</from>
- <heading>Reminder</heading>
- <body>Don‘t forget the meeting!</body>
- </note>
关于实体引用,转载了一篇文章解释的比较好:
通过字符和实体引用,可以通过引用将信息加入 XML 文档,而不必直接在文档中键入字符。在下列情况下,这样做很有用:
因为会被解释为标记,字符无法直接输入文档。
因为输入设备的限制,字符无法直接输入文档。
字符无法通过限于单字节字符的处理器可靠地传输。字符串或文档片断反复出现,并且可以缩写。为了显示内容,XML 提供了许多语法构造,以“and”符 (&) 开头,以分号 (;) 结尾。
通过字符引用,可以插入通过指向 Unicode 代码点的数字标识的 Unicode 字符。代码点可以使用十进制或十六进制表示法标识。
用于十进制引用的语法: &#value;
用于十六进制引用的语法: &#xvalue;
例如,要插入欧元符号,许多键盘上仍没有该字符,可以将 € 或 € 插入文档。
下表为 XML 标记使用的字符列出了五种内置实体。实体 实体引用 含义
实体 | 实体引用 | 含义 |
---|---|---|
lt
|
<
|
<(小于号)
|
gt
|
>
|
>(大于号)
|
amp
|
&
|
&(“and”符)
|
apos
|
'
|
‘(撇号或单引号)
|
quot
|
"
|
"(双引号)
|
如果字符可能会使 XML 分析器错误地解释文档结构,请使用实体,而不要键入字符。' 和 " 实体引用最常用在属性值中。
例一: 双引号的使用。
双引号作为XML 属性值的开始结束符号,因此无法在值中直接使用"". 处理方式可以分为两种。
a: 属性值中没有‘(单引号) ,那么可以用单引号‘‘ 作为属性值的开始结束符号
<add key="IPhone" value="apple"/> ...属性值为 ("apple").
解决: <add key="IPhone" value=’"apple"‘/>
b: 属性值中有‘(单引号) ,也有双引号。 如...属性值为 ("‘apple").
<add key="IPhone" value=""'apple""/>xml元素类型PCDATA和CDATA的区别(DTD中)