Le 7 juin 2010

Google détecte les erreurs 404 qui n’en sont pas


Google détecte les erreurs 404 qui n’en sont pas

Voila qui devrait permettre de résoudre certains mystères de pages non-indexées…

La firme californienne présente aujourd’hui une nouveauté qui complète ses très utiles outils pour les webmasters. Il s’agit de la différenciation entre les erreurs 404 basiques et celles du type soft 404 – même la version française ne fournit pas d’équivalent à cette expression.

Les soft 404 sont des pages d’erreurs qui retournent un code HTTP 200 (ce qui signifie « OK », la page est valide) au lieu d’un code 404 (« page non trouvée ») ou 410 (« la page n’existe plus »). Dans un tel cas, l’internaute ne voit pas la différence, mais les robots pensent que la page en question existe bel et bien. Vous ne souhaitez sans doute pas que votre site apparaisse en bonne place dans les résultats d’une requête de recherche [Fichier introuvable] suppose l’aide du moteur; c’est pourtant ce qui peut arriver dans une telle configuration.

Google parvient toutefois à détecter ces soft 404, généralement car elles contiennent toutes le même texte, qu’il s’agisse d’un message d’erreur ou que ce soit la reproduction pure et simple d’une autre page. Certains moteurs comme celui de Yahoo! ont même pour habitude de générer volontairement des requêtes vers des pages inexistantes de votre site pour comparer le résultat avec d’autres pages d’erreur éventuelles.

Pour découvrir les pages de votre site ayant retourné un contenu considéré comme étant de type 404, rendez-vous dans Google Webmasters Tools, sélectionnez Diagnostic puis Erreurs d’exploration dans le menu. Si par chance Google n’a pas détecté d’erreur de ce genre, le lien pour accéder à la liste ne s’affichera pas.

Publié le 7 juin 2010 à 21:13 par dans Actualité

Labels : ,

Billet trop ancien. Les commentaires sont maintenant fermés.