1.甚么是XML
XML(Extensible Markup Language)是一类记号词汇,用作叙述统计计算机程序和文本。与HTML较之,XML更为灵巧,即使它容许使用者表述他们的记号和原素。XML一般来说见作则表示形式化统计数据,因而能较好地与其它插件展开软件系统。
2. Java中的XML库
在Java中,有许多库能处置XML统计数据。当中最常见的是DOM(Document Object Model)和SAX(Simple API for XML)。
DOM数学模型将整座XML文档文件格式加载到缓存中,并将其则表示为两个树型内部结构。这使他们能随心所欲地结点和修正XML文档文件格式。但,假如XML文档非常大,则DOM数学模型可能会挤占大批缓存。
SAX数学模型则相同,它是一类如前所述设计模式的API。当导出器加载XML文档文件格式时,它会收到该事件并初始化适当的处置程序。这使SAX数学模型更适宜处置小型XML文档。
在采用Java食腐聚合XML文档
URL url = new URL(“;);HttpURLConnection conn =(HttpURLConnection) url.openConnection();conn.setRequestMethod(“GET”);BufferedReader reader = new BufferedReader(new InputStreamReader(conn.getInputStream()));String line;StringBuilder content = new StringBuilder();while ((line = reader.readLine())!= null){ content.append(line);}reader.close();conn.disconnect();
4.采用Jsoup导出HTML
于他们赢得的是HTML文件格式的统计数据,因而他们须要先将其导出为DOM数学模型。
在Java中,他们能采用Jsoup来将HTML导出为DOM数学模型。下面是两个采用Jsoup导出HTML的示例代码:
Document doc = Jsoup.parse(content.toString());
5.在Java中创建XML文档文件格式
一旦他们赢得了DOM数学模型,就能开始将其转换为XML文件格式。在Java中,他们能采用JAXB(Java Architecture for XML Binding)库来创建和操作XML文档文件格式。
JAXB提供了一类将Java对象序列化为XML文档文件格式的简单方法。他们只须要表述两个Java类,并采用JAXB注释来指定如何将该类映射到XML原素即可。
下面是两个简单的Java类及其对应的JAXB注释:
@XmlRootElementpublic class Person {@XmlAttribute public String name;@XmlElement public int age;}
上述代码表述了两个名为Person的Java类,该类有两个属性:name和age。采用@XmlRootElement注释指定该类能映射到XML原素,并采用@XmlAttribute和@XmlElement注释指定如何将属性映射到XML原素。
6.将DOM数学模型转换为XML文档文件格式
一旦他们表述了Java类,并采用JAXB注释将其映射到XML原素,就能将DOM数学模型转换为XML文档文件格式了。下面是两个采用JAXB将DOM数学模型转换为XML文档文件格式的示例代码:
JAXBContext context = JAXBContext.newInstance(Person.class);Marshaller marshaller = context.createMarshaller();marshaller.setProperty(Marshaller.JAXBFORMATTEDOUTPUT, true);StringWriter writer = new StringWriter();marshaller.marshal(person, writer);String xml = writer.toString();
上述代码创建了两个JAXB上下文,并采用该上下文创建了两个Marshaller对象。然后,他们将Marshaller的属性设置为文件格式化输出,并将Person对象序列化为字符串。
7.将XML写入文档
最后,他们须要将聚合的XML字符串写入文档。在Java中,他们能采用FileWriter或者BufferedWriter来同时实现这个功能。
下面是两个将XML写入文档的示例代码:
BufferedWriter writer = new BufferedWriter(new FileWriter(“person.xml”));writer.write(xml);writer.close();
8.总结
本文介绍了如何采用Java食腐将页面聚合XML文件格式的统计数据。他们首先讨论了XML的基本概念,然后介绍了Java中处置XML的
假如您正在处置互联网上的大批统计数据,因而须要将其存储为形式化统计数据文件格式,那么本文介绍的技术可能会对您有所帮助。