首页 > 代码库 > HTML/XML/XPATH基础

HTML/XML/XPATH基础

Html超文本标记语言

网页上单击右键→查看源文件/查看源代码

Html基本结构

<html>               为文档根元素,所有元素都在内部进行

  <head>         文档的头信息,不会在浏览器上显示

    ……

  </head>

  <body>         文档正文,显示浏览器上

    ……

  </body>

</html>

head中使用标签

<tittle></tittle>文档题目显示在标题栏中

<script></script>

<style></style>引用CSS样式

XML可扩展标记语言

http://www.yesky.com/imagesnew/software/html/index.html

XPath  xml文档中查找信息的一种语言

/以斜线开始路径实例1

 <AAA>               

  <BBB/>        

  <CCC/>

  <DDD>  

    <BBB/>     

  </DDD>

  <CCC/>

</AAA>                      XPath表达式:/AAA  选择根元素AAA

/以斜线开始路径实例2

<AAA>               

  <BBB/>        

  <CCC/>

  <DDD>  

    <BBB/>     

  </DDD>

  <CCC/>

</AAA>                       XPath表达式:/AAA/CCC  选择AAA的子元素CCC

/以斜线开始路径实例3

<AAA>               

  <BBB/>        

  <CCC/>

  <DDD>  

    <BBB/>     

  </DDD>

  <CCC/>

</AAA>                       XPath表达式:/AAA/DDD/BBB  选择AAA的子元素DDD的子元素BBB

//以双斜线开始路径实例1

<AAA>               

  <BBB/>        

  <CCC/>

  <BBB/>

  <DDD>  

    <BBB/>     

  </DDD>

<CCC/>

  <DDD>  

    <BBB/> 

    <BBB/> 

  </DDD>

<CCC/>

</AAA>                              XPath表达式://BBB  选择所有BBB元素

//以双斜线开始路径实例2

<AAA>               

  <BBB/>        

  <CCC/>

  <BBB/>

  <DDD>  

    <BBB/>     

  </DDD>

<CCC/>

  <DDD>  

    <BBB/>   

    <BBB/> 

  </DDD>

<CCC/>

</AAA>                          XPath表达式://DDD/BBB  选择所有父元素是DDD的BBB元素

*以星号开始路径实例1

<AAA>                    

  <CCC/>

    <DDD>  

      <BBB/>  

      <BBB/>   

      <EEE/>  

      <EEE/>

    </DDD>

  <CCC/>

</AAA>                                      XPath表达式:/AAA/CCC/DDD/*  选择所有路径依附于/AAA/CCC/DDD/的元素

*以星号开始路径实例2

<AAA>                    

  <XXX/>

    <DDD>  

      <BBB/>  

      <BBB/>   

      <EEE/>  

    </DDD>

  <XXX/>

  <CCC/>

    <BBB>  

      <BBB/>  

        <BBB/>   

      <BBB/>  

    <BBB/>

  <CCC/>

</AAA>                                     XPath表达式:/*/*/*/BBB  选择所有有3个祖先元素的BBB元素

*以星号开始路径实例3

<AAA>                    

  <CCC/>

    </DDD>

  <CCC/>

</AAA>                                  XPath表达式://*  选择所有元素

[]使用方括号限定元素实例1

<AAA>                    

  <BBB/>

  <BBB/>

  <BBB/>

</AAA>                                  XPath表达式:/AAA/BBB[1]  选择AAA的第一个BBB子元素

[]使用方括号限定元素实例2

<AAA>                    

  <BBB/>

  <BBB/>

  <BBB/>

</AAA>                                  XPath表达式:/AAA/BBB[last()]  选择AAA的最后一个BBB子元素

@通过@指定属性实例1

<AAA>                    

  <BBB id=“b1”/>

  <BBB id=“b2”/>

  <BBB name=“bbb”/>

  <BBB/>

</AAA>                                  XPath表达式://@id  选择所有的id属性(注意,选取的是元素的属性,而不是元素)

 

@通过@指定属性实例2

<AAA>                    

  <BBB id=“b1”/>

  <BBB id=“b2”/>

  <BBB name=“bbb”/>

  <BBB/>

</AAA>                                  XPath表达式://BBB[@id]  选择所有id属性的BBB元素(//BBB[@name]  选择所有name属性的BBB元素)

@通过@指定属性实例3

<AAA>                    

  <BBB id=“b1”/>

  <BBB id=“b2”/>

  <BBB name=“bbb”/>

  <BBB/>

</AAA>                                  XPath表达式://BBB[@*]  选择有任意属性的BBB元素

@通过@指定属性实例4

<AAA>                    

  <BBB id=“b1”/>

  <BBB id=“b2”/>

  <BBB name=“bbb”/>

  <BBB/>

</AAA>                                  XPath表达式://BBB[not(@*)]  选则没有属性的BBB元素

使用属性值作为选择准则1

<AAA>                    

  <BBB id=“b1”/>

  <BBB id=“b2”/>

  <BBB name=“bbb”/>

  <BBB/>

</AAA>                                  XPath表达式://BBB[@id=‘b1‘]  选则含有属性id=‘b1’的BBB元素

|使用分隔符“|”合并多个路径实例1

<AAA>               

  <BBB/>        

  <CCC/>

  <DDD>  

    <CCC/>     

  </DDD>

  <EEE/>

</AAA>                       XPath表达式:/AAA/EEE|//DDD/CCC|AAA|//BBB  合并没有限制

http:www.w3school.com.cn/xpath/index.asp

HTML/XML/XPATH基础