¿Qué desencadena este problema?
Este problema reporta todas las URL de las páginas internas de un sitio web que devuelva uno de los códigos de respuesta HTTP 4xx (Error del Cliente) que reciben algún tráfico de búsqueda orgánica (como por datos del explorador del sitio de Ahrefs).
¿Por qué es importante?
Los códigos de respuesta HTTP 4xx indican que hay un error en la solicitud del cliente. Los errores 4xx más comunes son 404 (no encontrado) y 403 (prohibidos). Dado que la página recibe tráfico orgánico, podría haber cambiado su estado a 4xx no hace tanto tiempo. Estas páginas se eliminarán del índice de búsqueda sólo después de que los motores de búsqueda las re-rasguñen (lo cual puede tomar un tiempo).
Las personas que llegan a las páginas 4xx de los resultados de la búsqueda definitivamente no estarán satisfechas y lo más probable es que salgan de su sitio web inmediatamente. Esto proporciona una mala experiencia de usuario y podría enviar señales negativas de comportamiento del usuario a Google.
Debe tener en cuenta que el tráfico de búsqueda orgánica en Ahrefs no es datos en tiempo real, y los motores de búsqueda ya podrían haber deindexado las URL 4xx.
¿Cómo solucionarlo?
Las URLs que devuelvan uno de los códigos de respuesta 4xx se eliminarán del índice de Google en un nuevo rasguño.
Si la página fue eliminada, movida o bloqueada involuntariamente, debería restaurarla.
También debe tener en cuenta que un sistema de protección DoS o la configuración de cortafuegos pueden bloquear el acceso al sitio web desde ciertas ubicaciones, haciendo que devuelvan el código 403 a usuarios específicos. Además, estos sistemas pueden estar bloqueando nuestro raspador específicamente a nivel de servidor, mientras que para los visitantes esta página puede estar en vivo.