首页 > 代码库 > java基础之概谈xml文件解析

java基础之概谈xml文件解析

XML已经成为一种很通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。诸多web应用框架,其可配置的编程方式,给我们的开发带来了很大程度的便捷,但细细想来,它们的应用无一不是java bean与xml之间的转换解析。本文将对xml的两种操作标准DOM和SAX,从它们各自的特点、适用范围等方面进行简单介绍。

     DOM (Document Object Model) :DOM标准中,采用W3C标准表示XML,有多重语言支持,因此其跨平台性很好。采用DOM规范处理xml时,会把xml文件整体加载进内存中,并在内存中建立对象树,对象树表示为Document对象,xml文件的根节点对应对象树的根节点,依次往下排列。因为整个xml文件被加载至内存中,所以基于DOM的处理对服务器内存要求比较高。但是正因为整个文件被加载,所以对文件本身的操作速度会比较快。注意这里所说的是文件本身,即文件被加载后的处理,比如对文件内部元素的遍历。但当文件本身很大时,由于加载速度及对内存的占用影响,因此从整体而言,其效率不一定好。

适用范围:小型 XML 文件解析、需要全解析或者大部分解析 XML、需要修改 XML 树内容以生成自己的对象模型

使用DOM解析xml文件的步骤:

1.获取DocumentBuilderFactory对象。

2.使用DocumentBuilderFactory对象生成DocumentBuilder对象。

3.使用DocumentBuilder对象解析xml文件得到Document对象。

4.从Document对象获得xml文件根节点。

5.通过Node节点出发获得文档信息。

     SAX (Simple API for XML) :SAX规范把xml文件作为数据流来处理的,读取一部分数据,处理一部分数据,它不需要将整个文件加载进内存,因此它很好的解决了DOM解析中资源占用的问题。SAX规范是基于事件驱动的,将XML数据文件中的不同内容归纳为不同的对象,解析不同对象时会产生不同事件,进而调用不同事件处理器。比如在开始解析文件时会产生文件解析事件,调用startDocument事件处理器;当读取节点的时候会产生开始元素事件,调用startElement事件处理器;同样,当读取节点内容、节点解析结束、文件解析结束时,会产生对应事件,调用相应的文件处理器进行处理。

适用范围:大型 XML 文件解析、只需要部分解析或者只想取得部分 XML 树内容、有 XPath 查询需求、有自己生成特定 XML 树对象模型的需求

使用SAX方式解析xml文档的步骤:

1.获取SAXParserFactory对象;

2.使用SAXParserFactory对象生成SAXParser;

3.调用SAXParser对象的parser方法对xml解析,然后获取解析结果。