掌握聚合最新动态了解行业最新趋势

API接口，开发服务，免费咨询服务

Xpath入门教程(简介、节点、语法、轴、运算符、实例代码)

来源：聚合数据类型：技术文章发布：2026-03-12 13:38:51

在XML和HTML文档处理中，XPath（XML Path Language）是一种强大的查询语言，用于定位和操作文档中的节点。无论是网页爬虫、自动化测试，还是数据提取，XPath都扮演着关键角色。本文将详细介绍XPath的基本概念，包括节点类型、语法结构、轴、运算符等，并通过实例代码帮助读者快速掌握XPath的使用方法。

一、XPath简介

XPath是用于在XML或HTML文档中导航和选择节点的语言。它提供了一种类似于文件系统路径的方式，允许开发者从复杂的文档结构中精准地定位所需元素。XPath不仅可以用于XML文档，也广泛应用于HTML解析中，特别是在Web开发和自动化测试中。

主要用途：

定位HTML或XML中的特定节点。

提取数据或执行操作。

与Selenium、BeautifulSoup等工具结合使用，实现网页内容的自动化处理。

与CSS选择器的区别：

XPath比CSS选择器更强大，尤其是在处理复杂层级结构时。例如，XPath可以轻松地根据属性、文本内容或位置进行查找，而CSS选择器则主要依赖于标签名、类名和ID等。

二、XPath中的节点类型

XPath支持多种类型的节点，了解这些节点有助于更准确地构建查询表达式。

元素节点（Element Node）：

每个XML/HTML标签都是一个元素节点，如 <div>、<p> 等。

属性节点（Attribute Node）：

元素的属性，如 id="main" 中的 id 是一个属性节点。

文本节点（Text Node）：

元素内部的文本内容，如 <h1>Hello</h1> 中的 “Hello”。

命名空间节点（Namespace Node）：

用于处理XML中的命名空间定义。

注释节点（Comment Node）：

XML/HTML中的注释内容，如 。

处理指令节点（Processing Instruction Node）：

如 <?xml-stylesheet ...?> 这样的特殊指令。

三、XPath语法基础

XPath的语法类似于路径表达式，通过“/”、“//”、“@”等符号来表示不同层级的节点关系。

基本路径表达式：

/：表示根节点，如 /html/body 表示从根节点开始查找 body 元素。

//：表示任意位置的子节点，如 //a 查找所有 <a> 标签。

谓词（Predicates）：

用于筛选满足条件的节点，通常用 [ ] 包裹。

示例：

//ul/li[1]  // 第一个 <li> 子节点
//input[@type='text']  // 所有 type 为 text 的 input 元素

通配符（Wildcard）：

*：匹配任何元素节点。

@*：匹配任何属性节点。

四、XPath轴（Axes）

轴用于描述节点之间的相对位置关系，是XPath中非常重要的概念。

常用轴：

child::：选取当前节点的子节点。

parent::：选取当前节点的父节点。

ancestor::：选取当前节点的所有祖先节点。

descendant::：选取当前节点的所有后代节点。

following-sibling::：选取当前节点之后的同级节点。

preceding-sibling::：选取当前节点之前的同级节点。

attribute::：选取当前节点的属性。

示例：

//div[@id='content']/child::p：选取 id 为 content 的 div 下的所有 p 子节点。

//input/@value：获取所有 input 元素的 value 属性值。

五、XPath运算符

XPath支持多种运算符，用于对节点进行逻辑判断和数值计算。

关系运算符：

=：等于。

!=：不等于。

<、<=、>、>=：比较大小。

逻辑运算符：

and：逻辑与。

or：逻辑或。

not()：逻辑非。

算术运算符：

+、-、*、/、%：加减乘除和取余。

示例：

//div[@class='item' and @id > '100']  // 选取 class 为 item 且 id 大于 100 的 div
//span[not(contains(text(), 'error'))]  // 选取文本中不含 'error' 的 span

六、XPath实例代码

以下是一些常见的XPath表达式示例，帮助读者更好地理解其应用。

查找所有链接：

//a

查找特定 ID 的元素：

//div[@id='header']

查找包含特定文本的元素：

//h1[text()='欢迎来到首页']

查找第 n 个子节点：

//ul/li[3]

查找某个元素的兄弟节点：

//div[@id='main']/following-sibling::div

查找具有特定属性的元素：

//input[@name='username']

组合条件查询：

//form[@method='post' and @action='/login']

XPath作为一种强大的节点查询语言，在XML和HTML文档处理中具有不可替代的作用。通过掌握XPath的基本语法、节点类型、轴、运算符以及实际应用，开发者可以高效地定位和操作文档中的元素，从而提升数据提取和自动化测试的效率。本文从简介、节点、语法、轴、运算符到实例代码进行了全面讲解，希望读者能够通过本教程快速上手XPath，并在实际项目中灵活运用。随着对XPath的深入学习，开发者还可以探索更高级的功能，如函数、变量和扩展表达式，进一步提升工作效率。

声明：所有来源为“聚合数据”的内容信息，未经本网许可，不得转载！如对内容有异议或投诉，请与我们联系。邮箱：marketing@think-land.com

API百科

生活服务企业工商金融科技接口大全电子商务

API资讯