java提供了dom、SAX、StAX、JAXB和Dom4j等多种xml解析方式,适用于不同场景:DOM适合小文件的增删改查;SAX内存占用低,适合大文件读取;StAX提供拉模式解析,控制更灵活;JAXB实现对象绑定,简化开发;Dom4j作为第三方库功能强大且易用。选择应基于文件大小、操作需求及性能要求。

Java读取和解析XML是开发中常见的需求,尤其是在处理配置文件、数据交换或Web服务时。Java提供了多种方式来读取和解析XML文档,主要方法包括DOM、SAX、StAX以及使用第三方库如JAXB和Dom4j。下面详细介绍每种方式的使用场景、优缺点和代码示例。
1. 使用DOM解析XML
DOM(Document Object Model)将整个XML文档加载到内存中,构建一棵树结构,便于随机访问和修改节点。适合小到中等大小的XML文件。
优点:支持增删改查操作,结构清晰。
缺点:占用内存大,不适合大文件。
示例代码:
import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.nodeList; public class DOMParserExample { public static void main(String[] args) throws Exception { DocumentBuilderFactory factory = DocumentBuilderFactory.newinstance(); DocumentBuilder builder = factory.newDocumentBuilder(); Document doc = builder.parse("example.xml"); NodeList nodes = doc.getElementsByTagName("student"); for (int i = 0; i < nodes.getLength(); i++) { Element element = (Element) nodes.item(i); String name = element.getElementsByTagName("name").item(0).getTextContent(); String age = element.getElementsByTagName("age").item(0).getTextContent(); System.out.println("姓名: " + name + ", 年龄: " + age); } } }
2. 使用SAX解析XML
SAX(Simple API for XML)是事件驱动的解析方式,逐行读取XML,触发开始元素、结束元素等事件。适合大文件,内存占用低。
立即学习“Java免费学习笔记(深入)”;
优点:内存效率高,适合流式处理。
缺点:只能读取,不能修改;编程复杂度较高。
示例代码:
import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; public class SAXParserExample { public static void main(String[] args) throws Exception { SAXParserFactory factory = SAXParserFactory.newInstance(); SAXParser parser = factory.newSAXParser(); parser.parse("example.xml", new StudentHandler()); } } class StudentHandler extends DefaultHandler { private boolean isName = false; private boolean isAge = false; public void startElement(String uri, String localName, String qName, Attributes attributes) { if (qName.equals("name")) isName = true; if (qName.equals("age")) isAge = true; } public void characters(char[] ch, int start, int length) { String content = new String(ch, start, length).trim(); if (isName && !content.isEmpty()) { System.out.println("姓名: " + content); isName = false; } if (isAge && !content.isEmpty()) { System.out.println("年龄: " + content); isAge = false; } } }
3. 使用StAX解析XML
StAX(streaming API for XML)结合了DOM和SAX的优点,提供“拉”模式的解析器,程序员主动控制读取过程,代码更易控制。
优点:内存高效,可读性强,支持双向操作。
缺点:API相对复杂。
示例代码:
import javax.xml.stream.XMLInputFactory; import javax.xml.stream.XMLStreamConstants; import javax.xml.stream.XMLStreamReader; import java.io.FileInputStream; public class StAXParserExample { public static void main(String[] args) throws Exception { XMLInputFactory factory = XMLInputFactory.newInstance(); XMLStreamReader reader = factory.createXMLStreamReader(new FileInputStream("example.xml")); while (reader.hasNext()) { int event = reader.next(); if (event == XMLStreamConstants.START_ELEMENT) { if ("name".equals(reader.getLocalName())) { System.out.println("姓名: " + reader.getElementText()); } else if ("age".equals(reader.getLocalName())) { System.out.println("年龄: " + reader.getElementText()); } } } reader.close(); } }
4. 使用JAXB进行对象绑定
JAXB(Java Architecture for XML Binding)可以将XML与Java对象相互转换,极大简化开发。适合已知结构的XML数据。
优点:代码简洁,面向对象。
缺点:需要定义类,灵活性较低。
示例代码:
// Student.java import javax.xml.bind.annotation.XmlElement; import javax.xml.bind.annotation.XmlRootElement; @XmlRootElement(name = "student") public class Student { private String name; private int age; @XmlElement public String getName() { return name; } public void setName(String name) { this.name = name; } @XmlElement public int getAge() { return age; } public void setAge(int age) { this.age = age; } } // JAXB读取示例 import javax.xml.bind.JAXBContext; import javax.xml.bind.Unmarshaller; import java.io.File; public class JAXBExample { public static void main(String[] args) throws Exception { JAXBContext context = JAXBContext.newInstance(Student.class); Unmarshaller unmarshaller = context.createUnmarshaller(); Student student = (Student) unmarshaller.unmarshal(new File("student.xml")); System.out.println("姓名: " + student.getName() + ", 年龄: " + student.getAge()); } }
5. 使用Dom4j(第三方库)
Dom4j是一个功能强大且易用的开源xml解析库,支持XPath、DOM、SAX等特性。
添加maven依赖:
<dependency> <groupId>dom4j</groupId> <artifactId>dom4j</artifactId> <version>1.6.1</version> </dependency>
示例代码:
import org.dom4j.Document; import org.dom4j.DocumentException; import org.dom4j.Element; import org.dom4j.io.SAXReader; import java.util.List; public class Dom4jExample { public static void main(String[] args) throws DocumentException { SAXReader reader = new SAXReader(); Document doc = reader.read("example.xml"); List<Element> students = doc.selectNodes("//student"); for (Element e : students) { String name = e.elementText("name"); String age = e.elementText("age"); System.out.println("姓名: " + name + ", 年龄: " + age); } } }
基本上就这些常用方式。选择哪种方法取决于你的具体需求:文件大小、是否需要修改、性能要求和开发便捷性。对于简单读取,推荐StAX或Dom4j;对于对象映射,JAXB更合适;若需灵活操作,DOM仍是不错选择。不复杂但容易忽略的是异常处理和资源释放,实际项目中应加以注意。


