正则表达式(也称为 REGEX 或 REGEXP)帮助您找到符合特定模式的 URL 或文本。 在 Site Explorer、Site Audit 和我们的 API 的某些端点中支持 REGEX。
Ahrefs 使用哪种 REGEX 系统?
我们使用RE2。
您可以使用此网站测试您的 Regex 表达式是否有效:https://regex101.com/。 请注意,您应从左侧菜单中选择“Golang”。
在 Site Explorer中过滤
允许您为特定 URL、域或文本字段进行过滤的报告支持 REGEX 过滤器。 您可以选择过滤“匹配正则表达式”或“不匹配正则表达式” :
以下是如何在引用域名报告中找到正则表达式过滤选项的示例:
您还可以检查更多过滤器以查找支持 REGEX 的字段:
在 Site Audit中过滤
在查看源代码中搜索
当您选择“使用正则表达式”选项时,可以在页面的 HTML 中搜索特定的 URL 或文本:
在抓取设置中包含和排除 URL
在任何项目的抓取设置中,您可以定义要包含或排除在任何抓取之外的一组特定 URL。 这些字段支持 REGEX:
任何无效的 REGEX 表达式将被忽略。 建议先使用类似https://regex101.com/ 的工具检查您的表达式是否正确工作
请记住,这些规则也适用于种子。 因此,每当您设置一个新模式时,请确保我们的爬虫有东西可以开始抓取。
如果同时使用了这两个字段,并且某个 URL 同时匹配“包含”和“排除”模式,Site Audit会将该 URL 从抓取中排除。
在高级筛选中筛选 URL 或域时
页面资源管理器和链接资源管理器支持高级过滤器,并且许多在设置过滤时提供“匹配 RegExp”的选项:
API 中的过滤语法
某些 Site Explorer 和 Keywords Explorer 工具的 API 端点允许使用where参数,支持使用 REGEX 模式。
请查看我们的API 文档,了解如何应用于它们的完整文档。





