跳转到主要内容

在 Ahrefs 中可以在哪里使用 REGEX(正则表达式)?

了解 Ahrefs 工具中支持 REGEX 的所有位置,以及它们如何用于创建更高级的过滤器

Constance Tan avatar
作者:Constance Tan
本周更新

正则表达式(也称为 REGEX 或 REGEXP)帮助您找到符合特定模式的 URL 或文本。 在 Site Explorer、Site Audit 和我们的 API 的某些端点中支持 REGEX。

💡了解更多关于如何使用 REGEX,以及一些可以使用的有用示例。

Ahrefs 使用哪种 REGEX 系统?

我们使用RE2

您可以使用此网站测试您的 Regex 表达式是否有效:https://regex101.com/。 请注意,您应从左侧菜单中选择“Golang”。

在 Site Explorer中过滤

允许您为特定 URL、域或文本字段进行过滤的报告支持 REGEX 过滤器。 您可以选择过滤“匹配正则表达式”或“不匹配正则表达式” :

以下是如何在引用域名报告中找到正则表达式过滤选项的示例:

您还可以检查更多过滤器以查找支持 REGEX 的字段:

在 Site Audit中过滤

在查看源代码中搜索

当您选择“使用正则表达式”选项时,可以在页面的 HTML 中搜索特定的 URL 或文本:

在抓取设置中包含和排除 URL

在任何项目的抓取设置中,您可以定义要包含或排除在任何抓取之外的一组特定 URL。 这些字段支持 REGEX:

任何无效的 REGEX 表达式将被忽略。 建议先使用类似https://regex101.com/ 的工具检查您的表达式是否正确工作

请记住,这些规则也适用于种子。 因此,每当您设置一个新模式时,请确保我们的爬虫有东西可以开始抓取。

如果同时使用了这两个字段,并且某个 URL 同时匹配“包含”和“排除”模式,Site Audit会将该 URL 从抓取中排除。

在高级筛选中筛选 URL 或域时

页面资源管理器和链接资源管理器支持高级过滤器,并且许多在设置过滤时提供“匹配 RegExp”的选项:

API 中的过滤语法

某些 Site Explorer 和 Keywords Explorer 工具的 API 端点允许使用where参数,支持使用 REGEX 模式。

请查看我们的API 文档,了解如何应用于它们的完整文档。

这是否解答了您的问题?