Les expressions régulières (également appelées REGEX ou REGEXP) vous aident à trouver des URL ou du texte qui correspondent à un modèle particulier. REGEX est pris en charge dans l'explorateur de site, l'audit de site et certains points de terminaison dans notre API.
💡En savoir plus sur la façon d'utiliser REGEX, ainsi qu'une liste d'exemples utiles que vous pouvez utiliser.
Quel système REGEX utilise-t-il Ahrefs ?
Nous utilisons RE2.
Vous pouvez tester si votre expression Regex fonctionne en utilisant ce site web : https://regex101.com/. Notez que vous devez sélectionner “Golang” dans le menu de gauche.
Filtrage dans l'explorateur de site
Les rapports qui vous permettent de filtrer des URL spécifiques, des domaines ou des champs texte spécifiques prennent en charge les filtres REGEX. Vous pouvez choisir de filtrer pour "regex" ou "Ne correspond pas à regex":
Voici un exemple de où trouver l'option de filtrer par REGEX sur le rapport Domaines référant:
Vous pouvez également vérifier Plus de filtres pour les champs qui supportent REGEX:
Filtrage dans l'audit du site
Recherche dans la vue source
Vous pouvez rechercher des URL ou du texte spécifiques dans le HTML d'une page si vous sélectionnez l'option "Utiliser une expression régulière" :
Inclure et exclure les URLs dans les paramètres Crawl
Dans les paramètres Crawl de n'importe quel projet, vous pouvez définir un jeu d'URL spécifique que vous souhaitez inclure ou exclure de n'importe quel explorateur. Ces champs supportent REGEX :
Toutes les expressions REGEX non valides seront ignorées. Il serait utile de vérifier d'abord que vos expressions fonctionnent correctement en utilisant un outil comme https://regex101.com/
Gardez à l'esprit que ces règles s'appliquent également aux seeds. Donc à chaque fois que vous définissez un nouveau patron, assurez-vous que notre crawler a quelque chose avec quoi commencer le crawl.
Si vous utilisez les deux champs et certaines URL correspondent à la fois aux modèles « Inclure » et « Exclure », l’audit du site exclura cette URL de l’exploration.
Dans les filtres avancés lors du filtrage pour les URLs ou les domaines
L'explorateur de pages et l'explorateur de liens prennent en charge les filtres avancés, et beaucoup ont la possibilité de sélectionner "Correspondance RegExp" lors du paramétrage d'un filtre:
Filtrer la syntaxe dans l'API
Certains points de terminaison de l'API pour l'explorateur de site et les outils d'Explorateur de mots-clés permettent le paramètre où
, ce qui vous permet d'utiliser les patrons REGEX.
Voyez la documentation complète sur la façon dont elles peuvent être appliquées dans notre documentation API.