Les pages dupliquées sont des pages avec des balises de titre identiques ou similaires, des balises de description, des balises H1 ou du contenu.
Vous pouvez vous demander, "tous les doublons ne sont pas mauvais ?"
Ce n'est pas vrai! Seulement lorsque deux pages en double n'ont pas leur Hreflang, ou les balises Canonical correctement définies pour montrer la relation entre elles, alors ils sont considérés comme mauvais doublons.
Hreflang - Moyenne deux ou plusieurs pages sont différentes langues ou versions régionales de la même page.
Canonical - Les deux pages sont identiques/similaires, mais on est marqué comme la version "officielle".
Vous pouvez effectuer un audit de site sur un site Web pour vérifier s'il y a de bonnes et de mauvaises doublons. Une fois l'audit du site terminé, vérifiez le rapport Rapport dupliqué pour trouver un graphique affichant les différents types de doublons trouvés dans un site Web:
Le graphique supérieur regroupe les pages internes dupliquées en fonction de l'évaluation des éléments de contenu (titre, méta description, H1 et contenu).
A Unique: Pages à contenu unique.
Bon duplique: Pages avec contenu dupliqué qui définissent une version principale unique avec leurs configurations canoniques, hreflang ou pagination
Mauvais doublon: des pages avec du contenu dupliqué qui ne sont pas correctement gérées avec leurs configurations canoniques, hreflang ou de pagination. Cela peut conduire à des problèmes d'indexation.
Non défini ou vide: Pages sans contenu. Ceci est susceptible d'affecter négativement vos performances de référencement.
Le graphique inférieur regroupe les URLs HTML internes avec le code d'état 200 en grappes en fonction de la similitude de leur contenu. Le nombre de pages dans chaque cluster est représenté dans chaque carré et correspond à sa taille, tandis que la couleur du carré indique si la duplication est gérée correctement via des balises canoniques.
Balise canonique correspondant à: Toutes les pages de la grappe ont la même balise canonique, ce qui signifie que le cluster a une URL canonique.
Balise canonique ne correspond pas à: Certaines ou toutes les pages de la grappe de lien vers des URL différentes via des balises canoniques. Cela peut conduire à des problèmes d'indexation.
Balise canonique non définie: Certaines ou toutes les pages du cluster n'ont pas de balise canonique. Cela peut conduire à des problèmes d'indexation.
Duplique avec un contenu similaire
Parfois, vous pouvez rencontrer un doublon signalé dans l'audit du site comme ayant un contenu « similaire ».
L'audit du site utilise une méthode intelligente d'extraction de texte pour extraire le contenu du corps du texte tel que les en-têtes, éléments, liens, etc, puis compare le contenu de toutes les pages ensemble. Si certains contenus sont très proches mais ne correspondent pas exactement, c'est là que le contenu sera marqué comme doublons « Similaires ».
Cependant, à l'occasion, deux pages qui n'ont pas de contenu similaire pourraient toujours être signalées comme similaires. Dans de tels cas, veuillez contacter le support à [email protected] ou sur notre chat en direct https://help. hrefs.com afin que nous puissions vérifier si les doublons ont été signalés correctement.