是什么引发了此问题?
此问题报告链接到JavaScript文件URL的页面,这些URL向我们的爬虫返回4xx或5xx HTTP状态码。 此类图像文件被广泛称为损坏的图像。
来自Chrome开发人员工具“网络”选项卡的截图:
为什么重要?
浏览器和搜索引擎将无法呈现损坏的JavaScript文件。 这可能会对您的网站用户体验产生负面影响。 如果JavaScript文件用于创建内容,搜索引擎将不会对其进行索引。
如何修复?
检查“链接JavaScript”列以了解文件的HTTP状态码。
这是您在此报告中可能遇到的最常见HTTP状态码:
404(未找到)HTTP状态码 指示文件可能已被移动或删除,但指向它的链接未更改。 要解决此问题,您可以使用旧URL恢复JS文件,编辑页面上的链接以指向相关文件,或者如果该JS文件不再需要,可以完全删除链接。
403(禁止)HTTP状态码 表明我们的爬虫未被允许访问JS文件。 您的服务器可能在某次抓取中开始阻止我们爬虫的请求。 这可能是由于服务器或防火墙配置所致。 您可以将 我们的IP地址列入白名单并运行新的抓取。
如果您的JS文件托管在阻止我方爬虫的外部服务器上,这也可能发生。
429(请求过多)HTTP状态码可能表示您项目抓取设置中的抓取速度对于网络服务器来说过高。 在抓取设置中降低速度并重新运行项目抓取。
5xx(服务器错误)HTTP状态码表示服务器存在一些问题,您应联系开发人员或托管服务提供商。 您的服务器可能配置不当、过载或总体上速度慢。

