如何通过文本查找 DOM 元素

介绍使用 querySelector 过滤、TreeWalker 遍历及 document.evaluate 的 XPath,实现按文本内容选取 DOM 元素。

Mar 18, 2026 · 3 min read

DOM API 中没有 getElementByText() 方法。如果你需要根据元素的文本内容而非元素类型来定位元素,就必须自己构建这种能力。这种需求出现的频率比你想象的要高——自动化脚本、UI 测试、动态内容解析——而正确的方法取决于你需要多大的灵活性。

核心要点

DOM API 没有内置的按文本内容选择元素的方法,但有三种原生方法可以填补这一空白:使用 querySelectorAll 过滤、使用 TreeWalker 遍历,以及使用 XPath 查询。
TreeWalker 是最通用的原生选项,可以在任何元素类型上进行全 DOM 文本搜索,而无需预先收集大型 NodeList。
在文本匹配时优先使用 textContent 而非 innerText——它更快,避免触发布局重计算,并且无论元素可见性如何都能保持一致的行为。
注意常见陷阱,如额外的空白字符、嵌套的后代文本,以及可能在脚本运行时尚未存在的动态注入内容。

为什么 querySelector 无法通过文本内容查询 DOM

querySelector() 和 querySelectorAll() 只接受 CSS 选择器。虽然 CSS 有 :has() 伪类和属性选择器,但没有标准的 CSS 选择器可以匹配元素的文本内容。像 div:text("Submit") 这样的选择器在规范中根本不存在。

这就给你留下了三种实用的方法:过滤候选集合、使用原生 API 遍历 DOM,或使用 XPath。

方法 1:按文本过滤候选集合

最简单的方法是通过标签或类查询元素,然后按文本过滤。当你预先知道元素类型时,这种方法效果很好。

function findByText(tag, text) {
  return [...document.querySelectorAll(tag)].filter(el =>
    el.textContent.trim() === text
  )
}

// 使用示例
const buttons = findByText('button', 'Submit')

当候选集合较小时,这种方法可读性好且速度快。缺点是:它一次只能搜索一种元素类型。使用 '*' 搜索所有元素虽然可行,但在大型 DOM 上速度较慢。

方法 2:使用 TreeWalker 遍历 DOM

TreeWalker 是一个内置的 DOM API,可以让你高效地遍历节点。它在所有现代浏览器中都得到良好支持,并且避免了预先收集完整 NodeList 的开销。

function findElementsByText(root, text) {
  const walker = document.createTreeWalker(
    root,
    NodeFilter.SHOW_ELEMENT,
    {
      acceptNode(node) {
        return node.textContent.trim() === text
          ? NodeFilter.FILTER_ACCEPT
          : NodeFilter.FILTER_SKIP
      }
    }
  )

  const results = []
  while (walker.nextNode()) results.push(walker.currentNode)
  return results
}

// 使用示例
const matches = findElementsByText(document.body, 'TV')

这种方法可以在整个树中搜索任何元素类型——这是特定标签方法无法提供的通用解决方案。它还支持提前终止,如果你只需要第一个匹配项的话。

关于 FILTER_SKIP 与 FILTER_REJECT 的说明: 这里使用 FILTER_SKIP 意味着遍历器仍会深入到不匹配节点的子节点中。如果你使用 FILTER_REJECT,遍历器会跳过该节点及其整个子树。对于文本搜索,FILTER_SKIP 几乎总是你想要的,因为即使父节点的 textContent 可能不匹配,更深层后代节点的内容可能会匹配。

方法 3:在 DOM 中使用 XPath 文本搜索

对于更具表达力的匹配,document.evaluate() 支持 XPath 表达式,包括基于文本的查询。这是处理复杂模式最强大的选项。

function findByXPath(expression, context = document) {
  const result = document.evaluate(
    expression,
    context,
    null,
    XPathResult.ORDERED_NODE_SNAPSHOT_TYPE,
    null
  )

  return Array.from({ length: result.snapshotLength }, (_, i) =>
    result.snapshotItem(i)
  )
}

// 查找任何包含文本 "Submit" 的元素
const els = findByXPath('//*[contains(text(), "Submit")]')

DOM 中的 XPath 文本搜索可以干净地处理部分匹配和复杂条件。权衡之处在于可读性——大多数前端开发者对 XPath 语法不太熟悉。

需要记住的一点:contains(text(), "Submit") 只匹配元素的直接文本节点。如果 “Submit” 位于子元素内部,这个表达式不会匹配父元素。要搜索所有后代文本,请改用 contains(., "Submit"),其中 . 指的是整个元素(包括其后代)的字符串值。

textContent 与 innerText:匹配时该使用哪个

这两个属性都返回文本,但它们的行为不同:

属性	返回内容	是否触发布局?
`textContent`	原始 DOM 文本,包括隐藏元素	否
`innerText`	仅渲染的文本	是(回流)

使用 textContent 进行文本匹配。它更快,不会触发布局重计算,并且无论元素可见性如何都能在所有元素上保持一致工作。

通过文本查找 DOM 元素时的常见陷阱

空白字符: textContent 包含来自 HTML 格式化的空白字符。比较前始终使用 .trim()。

嵌套文本: 元素的 textContent 包含所有后代文本。<div><span>TV</span></div> —— div 的 textContent 也是 "TV"。要明确你针对的是哪个元素层级。

动态内容: 页面加载后注入的文本在脚本运行时不会存在。使用 MutationObserver 或在确认内容存在后运行搜索。

选择正确的方法

已知元素类型,简单匹配 → 使用 querySelectorAll 过滤
任何元素类型,全 DOM 搜索 → TreeWalker
部分匹配或复杂模式 → 通过 document.evaluate() 使用 XPath

如果你在测试环境中工作,Testing Library 等工具提供了内置的 getByText() 方法——值得了解,尽管上述原生技术对于非测试脚本仍然至关重要。

总结

基于文本的 DOM 查找是标准 API 中的一个空白,但这三种方法涵盖了所有实际情况。当你知道元素类型时,使用带过滤器的 querySelectorAll 进行快速、有针对性的搜索。当你需要完整的 DOM 遍历而不想限定特定标签时,使用 TreeWalker。当匹配逻辑需要部分文本或复杂条件时,使用 XPath。无论选择哪种方法,都要优先使用 textContent 而非 innerText,比较前修剪空白字符,并考虑嵌套的后代文本以避免错误匹配。

常见问题

我可以使用 querySelector 通过文本内容查找元素吗?

不可以。querySelector 和 querySelectorAll 只接受 CSS 选择器,而 CSS 没有用于匹配文本内容的选择器。你需要使用基于 JavaScript 的方法,例如过滤 querySelectorAll 结果集、使用 TreeWalker 遍历 DOM,或使用 document.evaluate 运行 XPath 表达式来根据元素包含的内容定位元素。

TreeWalker 中 FILTER_SKIP 和 FILTER_REJECT 有什么区别?

FILTER_SKIP 告诉 TreeWalker 跳过当前节点但仍然访问其子节点。FILTER_REJECT 跳过该节点及其整个子树。对于基于文本的搜索,FILTER_SKIP 通常是正确的选择,因为父节点可能不匹配,但更深层的后代可能会匹配。

XPath 的 contains 与 text() 一起使用时会匹配子元素内的文本吗?

不会。表达式 contains(text(), value) 只检查元素的直接文本节点。如果目标字符串位于嵌套的子元素内,请改用 contains(., value)。点运算符指的是元素的完整字符串值,包括所有后代文本。

为什么在文本匹配时应该使用 textContent 而不是 innerText?

textContent 更快,因为它不会触发布局回流。它返回 DOM 子树中的所有文本,无论 CSS 可见性如何,使其保持一致和可预测。innerText 只返回渲染的文本,并强制浏览器重新计算布局,这为匹配目的增加了不必要的开销。

Open-source session replay

Complete picture for complete understanding

Capture every clue your frontend is leaving so you can instantly get to the root cause of any issue with OpenReplay — the open-source session replay tool for developers. Self-host it in minutes, and have complete control over your customer data.

Star on GitHub12k