정규 표현식(또는 REGEX, REGEXP)은 특정 패턴에 맞는 URL이나 텍스트를 찾는 데 도움을 줍니다. REGEX는 사이트 탐색기, 사이트 감사 및 특정 API 엔드포인트에서 지원됩니다.
Ahrefs는 어떤 REGEX 시스템을 사용합니까?
우리는 RE2를 사용합니다.
이 웹사이트를 사용하여 Regex 표현이 제대로 작동하는지 테스트할 수 있습니다: https://regex101.com/. 왼쪽 메뉴에서 "Golang"을 선택해야 합니다.
사이트 탐색기에서 필터링하기
특정 URL, 도메인 또는 텍스트 필드를 필터링할 수 있는 보고서는 REGEX 필터를 지원합니다. "일치하는 정규식" 또는 "정규식과 일치하지 않음"으로 필터링을 선택할 수 있습니다:
참조 도메인 보고서에서 REGEX를 사용하여 필터링 옵션을 찾을 수 있는 예시입니다:
REGEX를 지원하는 필드를 위해 추가 필터를 확인할 수도 있습니다:
사이트 감사에서 필터링하기
소스 보기에서 검색하기
페이지의 HTML에서 특정 URL 또는 텍스트를 검색할 수 있으며 "정규 표현식 사용" 옵션을 선택할 수 있습니다:
크롤 설정에서 URL 포함 및 제외
프로젝트의 크롤 설정 내부에서 포함하거나 제외할 URL의 특정 세트를 정의할 수 있습니다. 이 필드는 REGEX를 지원합니다:
유효하지 않은 REGEX 표현식은 무시됩니다. https://regex101.com/과 같은 도구를 사용하여 먼저 표현식이 올바르게 작동하는지 확인하는 것이 좋습니다.
이 규칙은 시드에도 적용된다는 점을 유념하세요. 새로운 패턴을 설정할 때마다 크롤러가 크롤링을 시작할 수 있는 무언가가 있는지 확인하세요.
두 필드를 모두 사용하고 URL이 "포함" 및 "제외" 패턴에 모두 일치하는 경우, 사이트 감사에서는 해당 URL을 크롤에서 제외합니다.
URL 또는 도메인을 필터링할 때의 고급 필터
페이지 탐색기와 링크 탐색기는 고급 필터를 지원하며, 필터를 설정할 때 "정규식 일치"를 선택할 수 있는 옵션을 제공합니다:
API에서 필터 구문
사이트 탐색기 및 키워드 탐색기 도구의 특정 API 엔드포인트는 where
매개변수를 허용하며, 이를 통해 REGEX 패턴을 사용할 수 있습니다.
이를 적용할 수 있는 방법에 대한 전체 문서는 API 문서에서 확인하십시오.