【Java 进阶篇】Java XML组成部分:理解XML的结构

在这里插入图片描述

XML(可扩展标记语言)是一种常用于存储和交换数据的标记语言。了解XML的结构和组成部分对于有效处理XML数据至关重要。在本篇博客中,我们将深入探讨XML的组成部分,以及如何使用Java来处理和操作XML数据。

什么是XML?

XML是一种标记语言,用于描述和存储数据。它的设计目标是可读性强、自解释、可扩展性好。XML文档包含标签、元素和属性,用于组织和描述数据。

XML的主要特点包括:

  • 自解释性:XML文档通常包含有关数据的描述,标签和元素名称通常清晰表达数据的含义,使其易于理解。

  • 层次性:XML数据以层次结构的方式组织,可以包含嵌套元素,形成父子关系,非常适合表示树状结构的数据。

  • 可扩展性:用户可以自定义标签和规则,因此XML适用于各种领域,从配置文件到数据交换。

  • 与平台无关:XML是一种与编程语言和操作系统无关的格式,因此可以在不同平台上读取和解析XML数据。

XML的基本结构

XML文档由以下几个基本部分组成:

  1. XML声明:XML文档通常以一个XML声明开始,用于指定XML的版本和字符编码。例如:

    <?xml version="1.0" encoding="UTF-8"?>
    
  2. 根元素:XML文档的根元素包含所有其他元素,是XML文档的起点。它位于XML文档的顶部,并用标签表示。例如:

    <bookstore><!-- 此处包含书籍信息 -->
    </bookstore>
    
  3. 元素:元素是XML文档中的基本构建块,由开始标签、结束标签和元素内容组成。例如:

    <title>Java编程入门</title>
    

    其中<title>是开始标签,</title>是结束标签,中间的文本 “Java编程入门” 是元素的内容。

  4. 属性:元素可以包含属性,属性提供有关元素的附加信息。属性位于元素的开始标签中,通常由名称和值组成。例如:

    <book ISBN="123456789"><!-- 此处包含书籍信息 -->
    </book>
    

    其中ISBN是属性的名称,123456789是属性的值。

  5. 注释:注释用于向XML文档添加注释性信息,不会被解析为数据。注释以<!--开始,以-->结束。例如:

    <!-- 这是一条注释 -->
    
  6. CDATA部分:CDATA(字符数据)部分用于包含文本数据,不会被解析为元素或实体。CDATA部分以<![CDATA[开始,以]]>结束。例如:

    <![CDATA[这是一段特殊的文本,不会被解析。]]>
    

XML的层次结构

XML文档的结构是层次性的,元素可以嵌套在其他元素内,形成层次结构。每个元素都有一个父元素,除了根元素,它没有父元素。

例如,考虑以下XML文档的结构:

<bookstore><book><title>Java编程入门</title><author>小明</author><price>29.99</price></book><book><title>Python入门教程</title><author>小红</author><price>24.99</price></book>
</bookstore>

在这个XML文档中,<bookstore>是根元素,它包含两个子元素<book>,每个<book>又包含三个子元素<title><author><price>。这种嵌套关系构成了XML文档的层次结构。

使用Java处理XML

Java提供了多种方式来处理XML数据,其中两种主要的是DOM解析和SAX解析。

DOM解析

DOM(文档对象模型)解析将整个XML文档加载到内存中,创建一个树状结构的文档对象模型。这种方式允许您以面向对象的方式访问和操作XML文档,但需要占用大量内存,因此不适合处理大型XML文件。

以下是一个使用DOM解析XML的示例:

import org.w3c.dom.*;
import javax.xml.parsers.*;
import java.io.*;public class DomParserExample {public static void main(String[] args) {try {File inputFile = new File("books.xml");DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();Document doc = dBuilder.parse(inputFile);doc.getDocumentElement().normalize();NodeList bookList = doc.getElementsByTagName("book");for (int temp = 0; temp < bookList.getLength(); temp++) {Node nNode = bookList.item(temp);if (nNode.getNodeType() == Node.ELEMENT_NODE) {Element eElement = (Element) nNode;System.out.println("Title: " + eElement.getElementsByTagName("title").item(0).getTextContent());System.out.println("Author: " + eElement.getElementsByTagName("author").item(0).getTextContent());System.out.println("Price: " + eElement.getElementsByTagName("price").item(0).getTextContent());}}} catch (Exception e) {e.printStackTrace();}继续上述代码的示例:```java}
}

在上面的示例中,我们使用DOM解析读取XML文件中的书籍信息。

SAX解析

SAX(简单API for XML)解析是一种事件驱动的解析方式,它逐行读取XML文档,触发事件来处理不同部分的数据。相比DOM,SAX解析占用较少内存,因此适合处理大型XML文件。

以下是一个使用SAX解析XML的示例:

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.*;
import java.io.*;public class SaxParserExample {public static void main(String[] args) {try {File inputFile = new File("books.xml");SAXParserFactory factory = SAXParserFactory.newInstance();SAXParser saxParser = factory.newSAXParser();DefaultHandler handler = new DefaultHandler() {boolean bTitle = false;boolean bAuthor = false;boolean bPrice = false;public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {if (qName.equalsIgnoreCase("title")) {bTitle = true;}if (qName.equalsIgnoreCase("author")) {bAuthor = true;}if (qName.equalsIgnoreCase("price")) {bPrice = true;}}public void characters(char ch[], int start, int length) throws SAXException {if (bTitle) {System.out.println("Title: " + new String(ch, start, length));bTitle = false;}if (bAuthor) {System.out.println("Author: " + new String(ch, start, length));bAuthor = false;}if (bPrice) {System.out.println("Price: " + new String(ch, start, length));bPrice = false;}}};saxParser.parse(inputFile, handler);} catch (Exception e) {e.printStackTrace();}}
}

在上面的示例中,我们使用SAX解析读取XML文件中的书籍信息。

生成XML

生成XML是将Java对象转换为XML文档的过程。Java提供了多种方式来生成XML,其中一种常用的方式是使用DOM库。

以下是一个使用DOM库生成XML的示例:

import org.w3c.dom.*;
import javax.xml.parsers.*;
import javax.xml.transform.*;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import java.io.File;public class DomXmlWriterExample {public static void main(String[] args) {try {DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();Document doc = dBuilder.newDocument();// 创建根元素Element rootElement = doc.createElement("bookstore");doc.appendChild(rootElement);// 创建书籍元素Element bookElement = doc.createElement("book");rootElement.appendChild(bookElement);// 创建标题元素Element titleElement = doc.createElement("title");titleElement.appendChild(doc.createTextNode("Java编程入门"));bookElement.appendChild(titleElement);// 创建作者元素Element authorElement = doc.createElement("author");authorElement.appendChild(doc.createTextNode("小明"));bookElement.appendChild(authorElement);// 创建价格元素Element priceElement = doc.createElement("price");priceElement.appendChild(doc.createTextNode("29.99"));bookElement.appendChild(priceElement);// 将文档写入XML文件TransformerFactory transformerFactory = TransformerFactory.newInstance();Transformer transformer = transformerFactory.newTransformer();DOMSource source = new DOMSource(doc);StreamResult result = new StreamResult(new File("new_books.xml"));transformer.transform(source, result);System.out.println("XML文件已生成!");} catch (Exception e) {e.printStackTrace();}}
}

在上面的示例中,我们创建了一个新的XML文档,并使用DOM库构建XML结构,然后将文档写入名为 “new_books.xml” 的文件。

操作XML

除了解析和生成XML,Java还提供了操作XML文档的能力。您可以使用DOM或其他库来遍历、修改和查询XML数据。

以下是一个使用DOM库操作XML的示例:

import org.w3c.dom.*;
import javax.xml.parsers.*;
import java.io.*;public class DomXmlModifierExample {public static void main(String[] args) {try {File inputFile = new File("books.xml");DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();Document doc = dBuilder.parse(inputFile);doc.getDocumentElement().normalize();// 获取根元素Element root = doc.getDocumentElement();// 添加新书籍Element newBook = doc.createElement("book");Element title = doc.createElement("title");title.appendChild(doc.createTextNode("新书标题"));Element author = doc.createElement("author");author.appendChild(doc.createTextNode("新书作者"));Element price = doc.createElement("price");price.appendChild(doc.createTextNode("19.99"));newBook.appendChild(title);newBook.appendChild(author);newBook.appendChild(price);root.appendChild(newBook);// 修改现有书籍NodeList bookList = doc.getElementsByTagName("book");for (int temp = 0; temp < bookList.getLength(); temp++) {Node bookNode = bookList.item(temp);if (bookNode.getNodeType() == Node.ELEMENT_NODE) {Element bookElement = (Element) bookNode;if (bookElement.getElementsByTagName("title").item(0).getTextContent().equals("Java编程入门")) {Element newPrice = doc.createElement("price");newPrice.appendChild(doc.createTextNode("25.00"));bookElement.appendChild(newPrice);}}}// 删除书籍NodeList bookListToRemove = doc.getElementsByTagName("book");for (int temp = 0; temp < bookListToRemove.getLength(); temp++) {Node bookNode = bookListToRemove.item(temp);if (bookNode.getNodeType() == Node.ELEMENT_NODE) {Element bookElement = (Element) bookNode;if (bookElement.getElementsByTagName("title").item(0).getTextContent().equals("新书标题")) {root.removeChild(bookNode);}}}// 将文档写回XML文件TransformerFactory transformerFactory = TransformerFactory.newInstance();Transformer transformer = transformerFactory.newTransformer();DOMSource source = new DOMSource(doc);StreamResult result = new StreamResult(new File("modified_books.xml"));transformer.transform(source, result);System.out.println("XML文件已修改!");} catch (Exception e) {e.printStackTrace();}}
}

在上面的示例中,我们打开一个XML文件,然后添加新书籍、修改现有书籍和删除书籍,最后将文档写回到XML文件中。

实际应用示例

让我们来看一个实际的应用示例:使用Java解析RSS订阅。RSS是一种常见的数据格式,用于发布博客文章、新闻等内容。我们可以使用Java解析并显示RSS订阅中的文章标题和链接。

首先,创建一个RSS订阅文件 rss_feed.xml,并添加一些文章项:

<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"><channel><title>示例RSS订阅</title><link>http://example.com/rss</link><description>这是一个示例RSS订阅</description><item><title>文章1标题</title><link>http://example.com/article1</link></item><item><title>文章2标题</title><link>http://example.com/article2</link></item></channel>
</rss>

接下来,我们可以编写Java代码来解析并显示RSS订阅的文章:

import org.w3c.dom.*;
import javax.xml.parsers.*;
import java.io.*;public class RssReaderExample {public static void main(String[] args) {try {File inputFile = new File("rss_feed.xml");DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();Document doc = dBuilder.parse(inputFile);doc.getDocumentElement().normalize();Element channel = (Element) doc.getElementsByTagName("channel").item(0);System.out.println("订阅标题: " + channel.getElementsByTagName("title").item(0).getTextContent());System.out.println("订阅链接: " + channel.getElementsByTagName("link").item(0).getTextContent());System.out.println("订阅描述: " + channel.getElementsByTagName("description").item(0).getTextContent());System.println("文章列表:");NodeList items = doc.getElementsByTagName("item");for (int i = 0; i < items.getLength(); i++) {Element item = (Element) items.item(i);System.out.println("标题: " + item.getElementsByTagName("title").item(0).getTextContent());System.out.println("链接: " + item.getElementsByTagName("link").item(0).getTextContent());System.out.println("---------------");}} catch (Exception e) {e.printStackTrace();}}
}

在上面的示例中,我们解析了一个包含文章标题和链接的RSS订阅文件,并将这些信息显示在控制台上。

总结

本篇博客详细介绍了XML的基本结构和组成部分,以及如何使用Java来解析和生成XML数据。我们了解了两种主要的XML解析方式:DOM解析和SAX解析,并演示了如何操作XML文档。最后,我们还探讨了一个实际应用示例,演示了如何使用Java解析RSS订阅。无论您是初学者还是有经验的开发人员,这些基础知识都将帮助您更好地理解和处理XML数据,为您的项目带来便利。希望这篇博客对您有所帮助!

作者信息

作者 : 繁依Fanyi
CSDN: https://techfanyi.blog.csdn.net
掘金:https://juejin.cn/user/4154386571867191

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/167592.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STM32:TIM通道输入捕获

本文主要讲解如何使用TIMER通道的输入脉冲捕获功能。基于STM32F7的Timer2 Channel3来进行讲解。 配置时钟 Timer2的时钟频率&#xff0c;对应APB1 Timer。 分频设置为96-1&#xff0c;这样设置每次count计数&#xff0c;对应的时间为1us。Counter设置为最大即可&#xff0c;默…

oracle实现搜索不区分大小写

<if test"code ! null and code ! ">and upper(code) like upper(%${code}%) </if>关键字upper

UE4/5 批量进行贴图Texture压缩、修改饱和度

该插件下载地址&#xff1a; &#x1f35e;正在为您运送作品详情https://mbd.pub/o/bread/ZZWYmpxw 适用于 UE4 4.25/4.26/4.27 UE5 以上版本 在Edit - Plugins中分别开启 插件 Python Editor Script Plugin 插件 Editor Scripting Utilites 如果会python代码&#xff0c;…

Mybatis的SqlRunner执行流程

Mybatis的SqlRunner执行流程 SqlRunner exec new SqlRunner(connection); Map<String, Object> row exec.selectOne("SELECT * FROM PRODUCT WHERE PRODUCTID ?", "FI-SW-01");connection.close();assertEquals("FI-SW-01", row.ge…

【C进阶】动态内存管理

一、为什么存在动态内存分配 我们之前学的都是开辟固定大小的空间&#xff0c;但有时候需要空间的大小只有在程序运行时才能知道&#xff0c;那么就引入了动态内存开辟 内存分布所在&#xff1a; 二、动态内存函数的介绍 2.1malloc和free 动态内存开辟的函数 void * malloc…

【Java 进阶篇】Java XML约束:确保数据一致性和有效性

XML&#xff08;可扩展标记语言&#xff09;是一种常用的数据交换格式&#xff0c;用于存储和交换数据。然而&#xff0c;为了确保数据的一致性和有效性&#xff0c;通常需要定义XML约束。XML约束是一种规则集&#xff0c;定义了XML文档的结构、元素、属性和数据类型。本篇博客…

centos如何根据端口号查询程序路径

centos如何根据端口号查询程序路径 如果是半路接受的应用&#xff0c;上个人只给你说了程序的端口号&#xff0c;别的都没&#xff0c;那怎么找程序的路径哪&#xff1f;一是给上上个人要&#xff0c;二是自己找&#xff08;我是自己找的&#xff09; 小白教程&#xff0c;一…

STM32F4_音乐播放器

目录 前言 1. WAV简介 1.1 WAVE文件的内部结构 2. WM8978简介 3. I2S简介 4. 硬件设计 5. 实验程序 5.1 main.c 5.2 I2S.c 5.3 I2S.h 5.4 WM8978.c 5.5 WM8978.h 前言 STM32F4开发板拥有全双工I2S&#xff08;也就是可以同时双向进行传输&#xff0c;A到B传输信息的…

Openssl数据安全传输平台007:共享内存及代码的实现 ——待完善项目具体代码和逻辑

文章目录 0. 代码仓库1. 使用流程案例代码&#xff1a; 2. API解析2.1 创建或打开一块共享内存区2.2 将当前进程和共享内存关联到一起2.3 将共享内存和当前进程分离2.4 共享内存操作 -&#xff08; 删除共享内存 &#xff09; 3. 思考问题3. ftok函数4. 共享内存API封装-以本项…

链表的中间结点-力扣

1、题目描述 给你单链表的头结点 head &#xff0c;请你找出并返回链表的中间结点。 如果有两个中间结点&#xff0c;则返回第二个中间结点。 题目链接&#xff1a;力扣&#xff08;LeetCode&#xff09;官网 - 全球极客挚爱的技术成长平台备战技术面试&#xff1f;力扣提供海…

在 Python 3 中释放 LightGBM 的力量:您的机器学习大师之路

机器学习是 Python 占据主导地位的领域,它一直在给全球各行各业带来革命性的变化。要在这个不断变化的环境中脱颖而出,掌握正确的工具是关键。LightGBM 就是这样一个工具,它是一个强大且快速的梯度提升框架。在这份综合指南中,我们将通过实际示例和示例数据集从基础知识到高…

大语言模型(LLM)综述(二):开发大语言模型的公开可用资源

A Survey of Large Language Models 前言3. RESOURCES OF LLMS3.1 公开可用的模型CheckPoints或 API3.2 常用语料库3.3 库资源 前言 随着人工智能和机器学习领域的迅速发展&#xff0c;语言模型已经从简单的词袋模型&#xff08;Bag-of-Words&#xff09;和N-gram模型演变为更…

简单说明反射和new的区别和反射的使用代码展示

目录 1.反射的认识 2.反射和new的区别 3.反射的使用代码展示 4.反射优点和缺点 1.反射的认识 反射是Java语言的一种机制&#xff0c;它允许程序在运行时检查和操作类、方法、字段等信息&#xff0c;而不需要提前知道它们的具体定义。通过反射&#xff0c;我们可以在运行时动…

Redis缓存(缓存预热,缓存穿透,缓存雪崩,缓存击穿)

目录 一, 缓存 1, 什么是缓存 2, 什么是热点数据(热词) 3, 缓存更新策略 3.1 定期生成 3.2 实时生成 二, Redis缓存可能出现的问题 1, 缓存预热 1.1 什么是缓存预热 1.2 缓存预热的过程 2, 缓存穿透 2.1 什么是缓存穿透 2.2 缓存穿透产生的原因 2.3 缓存穿透的解…

图论03-【无权无向】-图的深度优先DFS遍历-路径问题/检测环/二分图

文章目录 1. 代码仓库2. 单源路径2.1 思路2.2 主要代码 3. 所有点对路径3.1 思路3.2 主要代码 4. 路径问题的优化-提前结束递归4.1 思路4.2 主要代码 5. 检测环5.1 思路5.2 主要代码 6. 二分图6.1 思路6.2 主要代码6.2.1 遍历每个联通分量6.2.2 递归判断相邻两点的颜色是否一致…

概念解析 | 毫米波雷达与计算机视觉的融合

注1:本文系“概念解析”系列之一,致力于简洁清晰地解释、辨析复杂而专业的概念。本次辨析的概念是:毫米波雷达与计算机视觉的融合。 毫米波雷达与计算机视觉的融合 Sensors | Free Full-Text | MmWave Radar and Vision Fusion for Object Detection in Autonomous Driving: A …

最详细STM32,cubeMX串口发送,接收数据

这篇文章将详细介绍 串口 发送数据&#xff0c;接受数据。 文章目录 前言一、串口的基础知识二、cubeMX 配置三、自动生成代码解析四、串口发送数据函数五、使用串口收发数据点亮 led重定向函数&#xff1a; 总结 前言 实验开发板&#xff1a;STM32F103C8T6。所需软件&#xf…

pycharm操作git、前后端项目上传到gitee

pycharm操作git 之前用命令做的所有操作&#xff0c;使用pychrm点点就可以完成 克隆代码 上方工具栏Git ⇢ \dashrightarrow ⇢ Clone ⇢ \dashrightarrow ⇢ 填写地址&#xff08;http、ssh&#xff09; 提交到暂存区&#xff0c;提交到版本库&#xff0c;推送到远程 直接…

rust学习——函数返回值

概念 Rust 中的函数定义以 fn 开始&#xff0c;后跟着函数名和一对圆括号。大括号告诉编译器函数体在哪里开始和结束。 特殊的地方——函数返回值 错误的写法 正解1 去掉分号 fn main() {let x plus_one(5);println!("The value of x is: {}", x); }fn plus_…

【小白专用 已验证】PHP连接SQLServer数据库

PHP是一门强大的服务器端脚本语言&#xff0c;而SQL Server是Microsoft开发的一款关系型数据库管理系统。为了在PHP中直接操纵SQL Server数据库&#xff0c;需要通过安装SQL Server扩展来实现。这篇文章将详细介绍如何在PHP中使用SQL Server扩展来操作数据库。 首先&#xff0…