首页 > 代码库 > XML编程总结(四)——使用dom4j方式操作xml
XML编程总结(四)——使用dom4j方式操作xml
(四)使用dom4j方式操作xml
dom4j是解析XML的一种开源API,是jdom的升级品,用来读写XML文档。它具有性能优异、功能强大和极易使用的特点,它的性能超过sun公司官方的dom技术。dom4j对Xpath有良好的支持(使用xpath时需要导入jaxen的jar包),dom4j最大的特色使用大量的接口。使用dom4j时需要导入dom4j-xxx.jar包。
Attribute ——Attribute定义了XML的属性
Branch ——Branch为能够包含子节点的节点如XML元素(Element)和文档(Docuemnts)定义了一个公共的行为,
CDATA ——CDATA 定义了XML CDATA 区域
CharacterData——CharacterData是一个标识接口,标识基于字符的节点。如CDATA,Comment, Text.
Comment—— Comment 定义了XML注释的行为
Document—— 定义了XML文档
DocumentType—— DocumentType 定义XML DOCTYPE声明
Element—— Element定义XML 元素
ElementHandler ——ElementHandler定义了 Element 对象的处理器
ElementPath 被 ElementHandler 使用,用于取得当前正在处理的路径层次信息
Entity ——Entity定义 XML entity
Node ——Node为所有的dom4j中XML节点定义了多态行为
NodeFilter ——NodeFilter 定义了在dom4j节点中产生的一个滤镜或谓词的行为(predicate)
ProcessingInstruction ——ProcessingInstruction 定义 XML 处理指令.
Text ——Text 定义XML文本节点.
Visitor—— Visitor 用于实现Visitor模式.
XPath ——XPath 在分析一个字符串后会提供一个Xpath表达式
测试类代码:
1 public class Dom4jTest { 2 private Document doc; 3 4 @Before 5 public void setUp() throws Exception { 6 // 获得xml文档的输入流对象 7 InputStream is = Dom4jTest.class.getClassLoader().getResourceAsStream("books.xml"); 8 // 创建SAXReader对象 9 SAXReader reader = new SAXReader(); 10 // 通过流对象解析xml文档为Document对象 11 doc = reader.read(is); 12 } 13 14 /** 15 * 使用节点迭代器查询元素 16 * @throws Exception 17 */ 18 @Test 19 public void testRetrieve() throws Exception { 20 //获得文档的根节点 21 Element rootElement = doc.getRootElement(); 22 Iterator iterator = rootElement.elementIterator(); 23 while(iterator.hasNext()){ 24 //获得子节点,先转换为Element,有更多的方法 25 Element element = (Element) iterator.next(); 26 String value = http://www.mamicode.com/element.attributeValue("category"); 27 //获得属性为CHILDREN的book节点 28 if("CHILDREN".equals(value)){ 29 //获得book节点的迭代器 30 Iterator childIterator = element.elementIterator(); 31 while(childIterator.hasNext()){ 32 Node node = (Node) childIterator.next(); 33 //获取子节点的名称 34 String name = node.getName(); 35 if("price".equals(name)){ 36 //获取节点的文本 37 String text = node.getText(); 38 System.out.println(text); 39 } 40 } 41 } 42 } 43 } 44 45 /** 46 * 使用访问器来读取xml文档节点 47 * @throws Exception 48 */ 49 @Test 50 public void testRetrieveByVisitor() throws Exception{ 51 //获得xml文档的输入流对象 52 InputStream is = Dom4jTest.class.getClassLoader().getResourceAsStream("books.xml"); 53 // 创建SAXReader对象 54 SAXReader reader = new SAXReader(); 55 // 通过流对象解析xml文档为Document对象 56 Document doc = reader.read(is); 57 // 获得文档的根节点 58 Element rootElement = doc.getRootElement(); 59 //创建自定义的Visitor对象 60 Visitor visitor = new DomVisitor(); 61 //使用visitor查询文档 62 rootElement.accept(visitor); 63 } 64 65 /** 66 * 创建新的xml文档 67 * @throws Exception 68 */ 69 @Test 70 public void testCreate() throws Exception{ 71 //第一种,创建Document的方法(org.dom4j.Document) 72 //第一种创建方式是对第二种创建方式的封装 73 Document document = DocumentHelper.createDocument(); 74 //第二种,创建Document的方法(org.dom4j.Document) 75 //Document doc = DocumentFactory.getInstance().createDocument(); 76 77 //创建根元素节点 78 Element rootElement = document.addElement("bookstore"); 79 //创建book节点及其子节点 80 Element bookElement = rootElement.addElement("book"); 81 bookElement.addAttribute("CATEGORY", "CODING"); 82 Element title=bookElement.addElement("title"); 83 title.setText("JAVA CODING"); 84 Element author=bookElement.addElement("author"); 85 author.setText("zs"); 86 Element year=bookElement.addElement("year"); 87 year.setText("2010"); 88 Element price=bookElement.addElement("price"); 89 price.setText("69"); 90 //打印到控制台 91 writeToConsole(document); 92 //输出到文件 93 writeToFile(document); 94 } 95 96 //输出到文件 97 private void writeToFile(Document document) throws IOException { 98 //创建美化格式 99 OutputFormat format=OutputFormat.createPrettyPrint();100 XMLWriter writer=new XMLWriter101 (new FileWriter(new File("abook.xml")),format);102 writer.write(document);103 //关闭writer就会清空缓存104 writer.close();105 }106 107 //打印到控制台108 private void writeToConsole(Document document) throws IOException {109 //创建输出字符流110 PrintWriter writer=new PrintWriter(System.out);111 document.write(writer);112 //关闭writer就会清空缓存,才会输出来113 writer.close();114 }115 116 /**117 * 使用XPath查找节点,xpath序号从1开始118 * 要使用dom4j的xpath支持,需要导入jaxen包119 */120 @Test121 public void testXPath() throws Exception{122 //获得属性web的book节点123 Node node = doc.selectSingleNode("//book[@category=‘WEB‘]");124 //获得所有的book节点125 List nodes = doc.selectNodes("//book");126 //获得第2个book节点127 Node secondNode = doc.selectSingleNode("//book[2]");128 //将xml片段转换为字符串129 String xml = secondNode.asXML();130 System.out.println(xml);131 }132 133 @Test134 public void testStringToXML() throws Exception{135 String xmlString="<book category=‘CHILDREN‘><title lang=‘en‘>Harry Potter</title>"+136 "<author>J K. Rowling</author><year>2005</year><price>29.99</price></book>";137 //转换字符串为xml片段138 Document document = DocumentHelper.parseText(xmlString);139 //打印到控制台140 writeToConsole(document);141 }142 143 /**144 * 删除指定的节点145 * @throws Exception146 */147 @Test148 public void testDelete() throws Exception{149 //获得最后一个book节点150 Node node = doc.selectSingleNode("//book[4]");151 //获得最后一个book节点的父节点152 Element parent = node.getParent();153 //删除最后一个book节点,删除需要使用父节点来删除,删除成功则返回true154 Boolean flag=parent.remove(node);155 System.out.println(flag);156 //打印到控制台157 writeToConsole(doc);158 }159 160 /**161 * 修改指定的节点162 * @throws Exception163 */164 @Test165 public void testUpdate() throws Exception{166 //获得第一个book节点的price和year167 Node yearNode = doc.selectSingleNode("//book[1]/year");168 yearNode.setText("2015");169 Node priceNode = doc.selectSingleNode("//book[1]/price");170 priceNode.setText("59.00");171 //修改后的xml文档打印到控制台172 writeToConsole(doc);173 }174 }
Visitor子类代码:
1 public class DomVisitor extends VisitorSupport { 2 // 使用栈这个数据结构来保存 3 private Stack<String> stack = new Stack<String>(); 4 5 // 数据 6 private String attr; 7 private String title; 8 private String author; 9 private String year;10 private double price;11 12 @Override13 public void visit(Document document) {14 }15 16 @Override17 public void visit(Element node) {18 // System.out.println("element node-----------");19 20 //获得节点的名称21 String name = node.getName();22 if("book".equals(name)){23 if(!stack.isEmpty()){24 stack.clear();25 }26 stack.push(name);27 }else if("title".equals(node.getName())){28 stack.push(name);29 }else if("author".equals(name)){30 stack.push(name);31 }else if("year".equals(name)){32 stack.push(name);33 }else if("price".equals(name)){34 stack.push(name);35 }36 }37 38 @Override39 public void visit(Attribute node) {40 // System.out.println("attribute node-----");41 42 String peek = stack.peek();43 if("book".equals(peek)){44 String value =http://www.mamicode.com/ node.getValue();45 if("CHILDREN".equals(value)){46 attr=value;47 }48 }49 }50 51 @Override52 public void visit(Text node) {53 // System.out.println("text node--------");54 //注意:一个标签元素前后都有一个文本节点55 if("CHILDREN".equals(attr)){56 String tag = stack.peek();57 if ("title".equals(tag) && null==title)58 {59 title = node.getText();60 }61 else if ("author".equals(tag) && null==author)62 {63 author = node.getText();64 }65 else if ("year".equals(tag) && null==year)66 {67 year = node.getText();68 }69 else if ("price".equals(tag) && price==0)70 {71 price = Double.parseDouble(node.getText());72 System.out.println(this.toString()); 73 }74 } 75 }76 77 @Override78 public String toString() {79 StringBuilder sb=new StringBuilder();80 sb.append("book attribute:"+attr);81 sb.append("\n");82 sb.append("title:"+title);83 sb.append("\n");84 sb.append("author:"+author);85 sb.append("\n");86 sb.append("year:"+year);87 sb.append("\n");88 sb.append("price:"+price);89 sb.append("\n");90 return sb.toString();91 }92 }
使用Visitor子类读取文档结果:
book attribute:CHILDREN
title:Harry Potter
author:J K. Rowling
year:2005
XML编程总结(四)——使用dom4j方式操作xml