이 문제를 유발하는 것은 무엇입니까?
이 문제는 4xx 또는 5xx HTTP 응답 코드를 반환하는 URL로 링크된 페이지를 보고합니다.
왜 중요한가요?
4xx 또는 5xx URL에 대한 링크는 "깨진 링크"라고 알려져 있습니다. 웹사이트의 깨진 링크는 방문자가 클릭하여 페이지나 파일에 접근할 수 없게 하여 브라우징 경험을 해칩니다. 또한, 검색 엔진 크롤러에게 불필요한 "막다른 길"을 만들어 크롤링 예산을 낭비할 수 있습니다.
어떻게 해결하나요?
이 보고서의 다음 열에서 영향받는 페이지에서 링크된 깨진 URL과 그 HTTP 응답 코드를 볼 수 있습니다.
내부 아웃링크에서 4xx
내부 아웃링크에서 5xx
외부 아웃링크에서 4xx
외부 아웃링크에서 5xx
이 보고서에서 발견될 수 있는 일반적인 HTTP 상태 코드와 이 문제를 해결하는 방법은 다음과 같습니다:
404 (찾을 수 없음) HTTP 상태 코드는 링크된 페이지가 이동되거나 삭제되었지만 링크가 변경되지 않았음을 나타냅니다. 이 문제를 해결하기 위해, 이전 URL로 페이지를 복원하거나, 참조 페이지의 링크를 다른 관련 페이지를 가리키도록 수정하거나, 링크를 완전히 제거할 수 있습니다.
또는, 깨진 페이지에 대해 301 리다이렉션을 설정할 수 있습니다. 특히 많은 수의 인바운드 링크가 있는 페이지의 경우 이것이 특히 중요합니다. 하지만, 사이트 전반에 걸쳐 직접 링크를 가지는 것이 더 좋습니다.
403 (금지됨) HTTP 상태 코드는 크롤러가 링크된 URL에 접근할 수 없음을 나타냅니다. 서버가 크롤링 과정 중 어떤 시점에 요청을 차단했을 수 있습니다. 이것은 서버나 방화벽 구성으로 인해 발생할 수 있습니다. 당사 IP 주소를 화이트리스트에 추가하고 새로운 크롤링을 실행하세요.
외부 서버가 우리의 크롤러를 차단하여 페이지에 외부 링크가 있는 경우에도 발생할 수 있습니다.
429 (너무 많은 요청) HTTP 상태 코드들은 크롤링 속도가 설정해 놓은 네트워크 속도보다 빠르다는 것을 나타낼 수 있습니다. 크롤링 설정에서 이를 줄이고 프로젝트를 다시 크롤링하십시오.
5xx (서버 오류) HTTP 상태 코드는 서버 문제를 나타내며 개발자나 호스팅 제공업체와 상의해야 합니다. 서버가 잘못 구성되었거나 과부하 상태이거나 전반적으로 느릴 수 있습니다.