跳转到主要内容

Site Audit 访问常见问题排查

在Site Audit设置抓取时我收到错误信息。 我该如何解决?

Rebekah avatar
作者:Rebekah
本周更新

当你在Ahrefs创建一个新项目时,你可能会收到错误信息,指出我们的一台或两台机器人(AhrefsBot和AhrefsSiteAudit bot)无法抓取您的目标网站。

这意味着我们无法访问您的网站因为一些不可控的问题。 作为网站所有者,您可以采取一些措施来排查问题并允许我们的访问。

以下是一些常见问题:

1。 Robots.txt 规则不允许抓取

如果您看到下面的错误信息或“Robots.txt 规则不允许抓取”这样的信息,您的robots.txt可能正阻止我们抓取。

要检查这一点,请在我们的机器人检查器中输入您的网站:https://ahrefs.com/robot/site-audit

请确保您的robots.txt文件中没有针对AhrefsSiteAudit或AhrefsBot的禁止规则

您还可以在服务器上的robots.txt文件中添加以下几行:

User-agent: AhrefsSiteAudit
Allow: /

User-agent: AhrefsBot
Allow: /

2。 IP被阻止/获取robots.txt耗时过长/无法连接到服务器

如果您看到上述消息(或类似消息),请将我们的IP添加到服务器的白名单中。

另一个可能的问题是您的托管服务提供商正在阻止我们。 在这种情况下,请和他们联系以解决问题。

您还应该检查是否使用了任何可能阻止我们的插件并导致此错误。 例如,Incapsula插件会阻止我们。

3。 HTTP 服务器返回错误 403: “禁止”

这个错误信息通常表示我们的IP或用户代理(AhrefsSiteAudit和/或AhrefsBot)已被您网站的防火墙或插件阻止,我们的IP需要在此加入白名单。

4. 错误 406 不可接受:防火墙

如果您看到此错误信息,可能是由于您的网络服务器的配置、托管服务提供商管理的防火墙、您的CDN保护等原因造成的。

错误信息可能会提供有关原因的提示。 一些已知示例包括:ModSecurity、Sucuri、Cloudflare。

我们无法在我们这边解决这个问题。 您需要自行采取行动来解决此问题。

如果您不知道如何解决这个问题,请联系您的 Webmaster、托管公司或 CDN 以取消对我们机器人的封锁。 如果他们的支持聊天使用票务系统,请选择“技术支持”或最相近的类别。

您可以使用以下模板:

---------------

您好,

我管理的域名是<在此处插入网址>,我请求解封Ahrefsbot。 我想让它抓取我的网站,而这个功能目前被<在此处插入防火墙名称>禁止;。 Ahrefsbot没有任何“坏”机器人的特征 – 请参见:https://ahrefs.com/robot

非常感谢。

----------------

如果您没有在上面看到您的问题,或只是需要一些额外的指导,请联系我们的支持团队寻求帮助。

这是否解答了您的问题?