跳转到主要内容

我如何控制您的机器人的抓取行为?

了解您如何在网站上控制AhrefsBot的行为。

Helen avatar
作者:Helen
本周更新

我们的网页爬虫名为AhrefsBot,会抓取您的网站以记录出站链接并将其添加到我们的数据库中。 它会定期重新抓取您的网站,以检查之前找到的链接的当前状态。

该爬虫不会生成 URL,它只跟随互联网上找到的链接,并始终使用 GET(根据 HTTP 规范,这不应在服务器端触发任何破坏性操作)。

AhrefsBot严格遵守robots.txt中的禁止和允许规则。

要更改AhrefsBot访问您网站的频率,您可以在robots.txt文件中指定我们机器人两次连续请求的最小可接受延迟:

User-agent: AhrefsBot
抓取延迟: [值]

其中抓取延迟值为秒数。

如果由于某些原因您想阻止 AhrefsBot 访问您的网站,请将以下两行放入服务器上的 robots.txt 文件中:

User-agent: AhrefsBot
Disallow: /

请注意,AhrefsBot可能需要一些时间来读取您robots.txt文件中的更改。 这将在每次下次计划的抓取之前完成。

这是否解答了您的问题?