Le cloaking, sans doute la technique de spamdexing la moins détectable, aurait-il trouvé plus fort que lui ?
Google Analytics, le service de statistiques pour webmasters, pourrait-il servir à détecter le cloaking ? C'est en tout cas ce que semblent penser certains spécialistes de ce domaine.
Pour commencer, rien de tel qu'une définition. Le cloaking est "une technique permettant de fournir une page différente aux moteurs de recherche de celle visible par un internaute. Le cloaking consiste à détecter à chaque fois qu'une page est demandée par un visiteur s'il s'agit d'un internaute humain ou d'un robot d'un moteur de recherche, et à fournir une page différente selon les cas. L'objectif est en général de tromper le moteur de recherche en lui fournissant une page optimisée spécialement pour lui, avec par exemple un grand nombre de mots-clés répétés." [source Dicodunet] Attention, le cloaking est prohibé par Google, comme c'est indiqué dans les guidelines. A utiliser à vos risques et périls !
Il existe plusieurs façons de réaliser un cloaking pour différencier les robots des humains. La plus simple est détecter l'agent-utilisateur (user-agent) du visiteur, et de rediriger en fonction de celui-ci. Ainsi, si l'agent-utilisateur ressemble à "Googlebot/2.1 (+http://www.googlebot.com/bot.html)", pas de doute, c'est Google. Il est cependant simple de vérifier si une page utilise ce type de cloaking : en changeant l'agent-utilisateur du navigateur. Des extentions Firefox permettent de faire cela facilement.
Autre technique, plus complexe à mettre en place : se baser sur l'adresse IP. Il faut pour cela connaître toutes les adresses IP utilisées par les robots des moteurs de recherches, et autant dire que la liste est longue. Une fois ce système installé, il est vraiment difficile de détecter cette ruse, car pratiquement impossible d'usurper une IP de Google pour le commun des mortels. C'est ainsi qu'avait procédé une équipe pour récupérer un Page Rank 10 en 2004.
Pourtant, certains annoncent "la mort du cloaking [sur IP]". Pourquoi ? Grâce à une découverte récente. C'est Jan qui décrit la marche à suivre :
C'est arnoweb2 qui m'a interpelé sur le forum de Webmaster-Hub. Google Analytics permet maintenant de voir le web avec les yeux de Googlebot. Nos pages cloakées, jusqu'alors réservées à Googlebot et peaufinées pour lui plaire, sont désormais accessibles à tous.
La méthode est très simple:
Dans Analytics, créez le profil du site web que vous voulez examiner,
Affichez les rapports du site ainsi créé (il n'est pas nécessaire que le marqueur ait été inséré dans les pages du site),
Choisissez la fonction Synthèse données/site...
... et voilà! Vous voyez la page telle que la voit Googlebot s'afficher dans l'iframe.
A priori, impossible de différencier une visite via Analytics d'un vrai crawl de Googlebot. L'user agent, l'adresse IP et l'hôte sont identiques, et comme Googlebot, Analytics se présente sans référant.
Jan a déjà trouvé une parade, en interdisant l'affichage dans une iframe...*
A quand et par qui la prochaine surenchère ? Peut-être prochainement un navigateur "Voyez votre site à la google" ou une autre astuce pour se faire passer pour Googlebot sur un site.
Edition du 4/3 à 17h40 par TomHtml : Finalement, malgré le JavaScript utilisé pour bloquer l'affichage quand le site n'est pas diffusé dans une iframe, il est possible d'acceder au site... La preuve avec cette page de test de Jan, que j'ai réussi à visualiser malgré tous les barrages mis en place, grâce à Google Analytics :
Deux solutions possibles pour continuer à faire son cloaking tranquillement : soit bloquer l'adresse IP particulière utilisée (s'il n'y en a qu'une...), soit c'est Google Analytics qui va bientôt interdire cette utilisation si l'utilisateur n'a pas "validé" son site, c'est-à-dire prouver qu'il en est l'auteur....
L'actualité de Google et de ses (nombreux) produits et services, vue par l'équipe de Zorgloob au 3 mars 2007
Google en bref rapide cette semaine : un service Google - une news.
Google AdWords : Google communique sur la fraude au clic. D'après Google, moins d'un clic sur 5000 est invalide. D'après Google.
Google Desktop :Deux failles (XSS) ont récemment été corrigées sur Google Desktop. Dans les faits, rien de bien méchant. En parlant de faille, un petit malin avait mis en vente sur Ebay une faille, pour 500 euros. "Avait" car Ebay vient de clore l'enchère.
Google Translate : Si vous utilisez le traducteur Google pour l'Arabe, le Chinois et le Russe, et que vous constatez des erreurs de traduction, vous pouvez les corriger ! Du moins, suggérer une meilleure traduction à Google...
Google Images : Tout comme dans la recherche web habituelle, désormais lorsque vous tentez d'accéder à un site qui pourrait contenir des malwares, virus (...), Google vous avertit.
Google Tableur : Bientôt des graphiques dans Google Spreadsheet ! Garett Rogers en a la preuve.
Google Reader :Premier en terme de lecteurs, deuxième en terme de clics.
Google Gadgets : Mises à jour du côté des gadgets de Google (utilisés pour la page d'accueil personnalisée ou dans Google Desktop). Affichage du nombre d'utilisateurs, possibilité de laisser des commentaires à propos du gadget, etc.
Google IG : La page d'accueil personnalisée du géant de Mountain View est elle aussi dotée d'une nouvelle fonctionnalité. Désormais, lorsque vous ajouterez un nouvel onglet, Google vous proposera de remplir automatiquement la page de gadgets sélectionnés en fonction du titre que vous aurez choisi pour l'onglet.
Google Recherche de Livres : Google Books est désormais disponible en chinois.
Google Rebang : "/rebang" est un répertoire découvert par Philipp Lenssen récemment. Apres moult spéculations, il semble que ce soit le Google Zeitgeist des chinois. En plus flashy. Dommage qu'il ne soit plus accessible pour l'instant.
Google Vidéo : Encore une "plusbox" ! Les plusbox, ce sont les informations qui apparaissent dans les pages de résultats et que vous ne pouvez découvrir sans cliquer sur le bouton "+". Après les cartes, les cours de la bourse, voici venir les vidéos ! Pas forcément utile, et aperçu une seule fois seulement.
Google Vidéo Blog : le blog de Google Vidéo s'arrête ! Les équipes de Google Vidéo vont désormais écrire leurs articles dans le blog de YouTube...
YouTube : "La technologie Youtube valorisée à seulement 24 millions de dollars", indique Didier Durand. "La majeure partie du prix est du goodwill."
Google Talk : Twitter, vous connaissez ? Un service qui vous permet de décrire en quasi direct ce que vous faites. Si ça vous intéresse, sachez que vous pouvez désormais utiliser Google Talk pour envoyer vos informations.
Et voila, vite fait bien fait :-) Bon week-end sur Zorgloob.com !
Google Webmaster Tools, jadis nommé Google Sitemaps, a été mis à jour. Les fans des backlinks seront ravis...
Google Webmaster Tools, la partie de Google destinée à renseigner les webmasters sur l'indexation de leurs sites, a été mise à jour. Et ce même dans la version française. Le "Centre Google pour les webmasters", autrefois connu sous le nom de Google Sitemaps, est désormais doté d'un nouvel onglet : "Liens".
Google Webmaster Tools dispose d'un nouvel onglet.
Vous n'aurez accès à cette rubrique qu'une fois votre site sera "validé" (fichier ou balise META). Cette page regroupe la liste de vos pages indexées, ainsi que le nombre de backlinks pour chacune d'entre-elles. Cliquer sur ce nombre vous donnera une liste des pages web qui font un lien vers la page en question de votre site.
Il est important de noter qu'il est déjà possible de connaitre les backlinks d'une page, grâce à l'opérateur "link:". Cependant, cette commande est bridée, et bien que Google Webmaster Tools n'affiche pas tous les backlinks lui non plus, le nombre affiché est en moyenne 10 fois supérieur à celui indiqué dans les pages de résultats. Le backlink est une notion importante du référencement, et ce sont donc les référenceurs (SEO) qui seront ravis de découvrir cette nouvelle fonctionnalité.
Ionut Alex Chitu a fouillé dans ces listes et a découvert que Google prenait en compte les backlinks... provenant de fichiers PDF ! Quant à Philipp Lenssen, à peine cette nouvelle fonctionnalité lancée qu'il découvre déjà une "faille". Il est en effet possible de découvrir la liste presque complète (puisque la vraie liste complète des backlink n'est jamais donnée, même pour votre site, comme le confirme Matt Cutts) des backlinks de vos concurrents. Quelques chiffres en passant : Google.com (1 432 908 backlinks, et plus de 13 millions si l'on prend en compte les liens pointant sur des pages hébergées sur ce site), News.google.com (1 404 701), CNN.com (1 403 769), Youtube.com (813 501), Digg.com (492 480), Google.fr (467 204), Webrankinfo.com (226 554), Mozbot.fr (208 240), Googleblog.blogspot.com (202 764), Netvibes.com (189 867), Example.com (71 559), Exalead.com (61 481), Wikio.fr (42 796), ...
A part ça, un bouton en haut de l'écran pour changer rapidement de site, et une nouvelle citation dans la partie "statistiques" :
La plus grande erreur que puisse faire un homme est d'avoir peur d'en faire une. Elbert Hubbard (1856-1915), The Note Book.
Vous utilisez Netvibes, le portail personnalisable français, ainsi que le module vous permettant de lire vos mails directement dans Netvibes ? Alors votre compte Google était en danger...
Une faille a été découverte sur Netvibes par un blogueur. Cette faille permettait d'accéder à de nombreuses informations telles que des calendriers, des notes, mais aussi des identifiants de connexion aux comptes Google de certains utilisateurs. Notamment ceux utilisant Netvibes pour afficher les titres des derniers mails.
L'équipe de Netvibes a rapidement corrigé la faille et publié un communiqué sur leur blog, indiquant qu'aucun compte n'avait été visité et que le problème et bel et bien réglé.
Le blogueur avait relaté son exploit sur un blog, supprimé depuis... Heureusement, ¥€$ est là et je vous conseille de lire son article, captures d'écran à l'appui...
L'actualité de Google et de ses (nombreux) produits et services, vue par l'équipe de Zorgloob au 23 janvier 2007
Au sommaire : le site allemand de Google détourné, mises à jour sur Google IG et l'historique des recherches, un nouveau data-center, et bien d'autres nouvelles encore.
Google Allemagne détourné : hier à 20h30, les Allemands ont eu l'étrange surprise de voir que Google.de n'avait plus de rapport avec Google. Bien que l'adresse n'était pas redirigée, le contenu était celui du site Goneo.de. Voici ce qui s'est passé dans les coulisses, comme le traduit et résume Philipp Lenssen à partir des médias germaniques. A la mi-janvier, le détenteur du site Goneo.de a fait une requête auprès du DeNIC (l'AFNIC local), pour signifier que Google.de était un nom de domaine qui lui appartenait. Sans plus de vérifications, DeNIC a demandé à Google Inc. si le changement pouvait être effectué. Mais Google n'a pas répondu à la question dans les temps (5 jours), ce que le DeNIC a traduit comme un accord tacite. Dès lors, le changement automatique du propriétaire du domaine a eu lieu, de Google à Goneo. Peu de temps après avait eu lieu une nouvelle requête et le domaine changeait une nouvelle fois de main. C'est à 9 heures ce matin que tout est rentré dans l'ordre.
La page d'accueil personnalisée mise à jour : nombreux sont les lecteurs de Zorgloob a nous avoir contacté pour nous signaler un changement mineur sur Google IG. Celui concerne les modules de flux RSS, dont le design a été légèrement retouché pour permettre de lire l'article en cliquant sur le "+" à côté du titre. La date des articles est également affichée. En parlant de flux, les flux RSS et ATOM de Zorgloob sont de nouveau en état de marche depuis quelques jours. J'ai dû bidouiller un peu pour que ça tienne bon... Si toutefois vous avez encore des problèmes avec les flux, n'hésitez pas à nous contacter.
Nouveauté dans l'historique des recherches :l'historique des recherches Google permet de rechercher parmi vos recherches sur le moteur de recherche Web, sur Google Images, sur Google Video, sur Google News, sur Froogle, sur Google Maps. Depuis peu, vous pouvez également rechercher parmi... les publicités AdWords sur lesquelles vous avez cliqué ! Pour ce faire, il suffit de cliquer sur le lien "Sponsored Links" à gauche. [via Google Operating System]. Par ailleurs, dans la version anglaise de l'historique, un nouveau lien a également fait son apparition : "Interesting items", qui est censé vous présenter des résultats en rapport avec vos recherches.
Nouveau Data Center : 600 millions de dollars, c'est le prix que coutera la construction d'un nouveau centre de données pour Google à Lenoir, en Caroline du Nord (Etats-Unis). Les 200 emplois qui y seront créés devraient avoir un large impact économique. [via Valleywag]
Google dans vos jeux vidéos ?Google serait en discussions avec le californien Adscape Media, dans le domaine des technologies publicitaires en ligne sur jeux vidéos, indique WebRankInfo selon les informations du WSJ.
Acheter et télécharger ses livres sur Google : c'est ce que va bientôt proposer le géant de Montain View, en partenariat avec des sociétés d'édition. Une fois téléchargé, destination iBook ou encore Blackberry. Notez qu'il est déjà possible de télécharger les livres tombés dans le domaine public sur Google Books. Par ailleurs, Google a scellé un nouveau partenariat pour la numérisation de livres, cette fois-ci avec l'Université du Texas.
Encore une fuite : dans la liste des adresses bloquées par Google pour prévenir du phishing, une équipe a découvert des informations sensibles comme des logins et mots-de-passe. Le problème a été corrigé par Google qui affirme que cela ne concernait qu'une douzaine d'adresses.
¡ España ! Pour finir, un petit tour du côté des bureaux de Google à Madrid. C'est le quotidien El Pais qui nous fait la visite en photos, ainsi que des interviews des têtes connues du Googleplex (Marissa Mayer, Matt Cutts, Louis Monier, ...). Quelques informations intéressantes, résumées par Dirson :
Google est l'entreprise qui a connu la plus forte croissante de l'histoire en Espagne. En 5 ans, ses revenus ont augmenté de 437%
Félix Hernández-Campos, ingénieur, est le seul espagnol à travailler au Googleplex de Mountain View. (note : j'ai compté deux français seulement au Googleplex, qui dit mieux ?)
Dans les toilettes du Googleplex, il y a des problèmes et des exercices collées sur les portes, comme ça les googlers n'arrêtent jamais de réfléchir.
Les failles de sécurité sont souvent critiques. Elle le sont encore plus quand le site concerné, Google, contient un grand nombre d'informations sur votre vie privée...
Il y a quelques jours, nous vous révélions la présence d'une faille de sécurité pour Gmail. Découverte par l'auteur du blog Googlified.com, Haochi Chen, celle-ci permettait à une personne malintentionnée de récupérer la liste de toutes les adresses e-mail de vos contacts Gmail. Et ce avec quelques simples lignes de codes, preuve à l'appui. Le problème a depuis été corrigé, du moins officiellement.
Quelques jours plus tard, Tony Ruscoe a découvert une autre faille. Celle-ci visait une nouvelle fonctionnalité de Blogger, qui permet d'afficher le contenu de son blog example.blogspot.com sur www.example.com sans que l'internaute ne sache où est hébergé le blog. Tony a remarqué que l'on pouvait entrer n'importe quel nom de domaine, y compris ceux de Google. De ce fait, on pouvait récupérer le cookie (correspondant à Google.com) de l'internaute, et ainsi avoir accès à son compte ! Du moins, pas tout le compte, juste une partie, mais c'est déjà trop. Cela fait froid dans le dos. L'équipe technique chargée de la sécurité a réglé le problème au plus vite.
Les Googlers pensaient souffler un peu quand Haochi Chen, encore lui, a découvert une faille dans Google Base. Bien plus simple d'utilisation que la précédente. Cette faille XSS était connue depuis un an, et corrigée, mais le récent changement de design sur Google Base a fait réapparaître le trou de sécurité. Averti avant que Google ne colmate la faille, j'ai pu m'amuser avec celle-ci, notamment en subtilisant les cookies de mon confrère Luka. J'ai ainsi pu accéder à sa page d'accueil personnalisée Google IG, voir les sujets de ses mails et son agenda grâce à celle-ci, consulter ses messages de Google Reader, consulter son historique des recherches ou encore utiliser son Google Notebook. Pas de panique, il est au courant ;-) Il n'empêche, cela fait quand même peur. Le seul moyen pour lutter contre ces éventuels actes de piratage est de surfer déconnecté de son compte Google.
Si vous aussi vous découvrez une importante faille sur l'un des domaines de Google : premièrement, contactez-nous:-D Deuxièmement, écrivez à security@google.com.
Visiblement, les problèmes de sécurité importent peu les actionnaires de Google, puisque pendant ce temps le cours de GOOG battait un nouveau record : 513 dollars l'action.
Comme l'on constaté les utilisateurs du forum de Webrankinfo, la calculatrice et le convertisseur intégrés dans le moteur de recherche Google ne fonctionnent plus.
Le résultat de 2234*232-1987 s'affiche dans la barre de recherche de la barre d'outils Google, mais pas dans le moteur de recherche en lui même, comme il le fait depuis près de 4 ans maintenant. La conversion ne fonctionne pas non plus, ainsi 20 euros en dollars ne donne pas de résultat.
Pourtant cette fonctionnalité est toujours présente dans l'aide de Google. Cet article sera mis à jour si le problème est résolu.
PS : en 24 heures, la taille de l'espace Gmail a cessé de progresser, le compte Gmail a pu être détourné et des fonctions de base ont cessé de fonctionner. Décidément, 2007 commence mal pour Google...
Les premières 24 heures de 2007 ne sont pas encore écoulées qu'une faille à risque a été découverte sur Google...
Une faille critique a été découverte sur les serveurs de Google, qui pourrait être utilisée par les spammers pour inonder les adresses mails de vos contacts. Cette faille a été découverte cette nuit par Haochi Chen, rédacteur du site Googlified.com (un peu le Zorgloob outre-Atlantique ;-) ).
Tout commence en fait samedi, quand Ionut Alex Chitu du blog Google Operating System découvre dans les lignes de codes de Google Vidéo une fonction permettant d'afficher la liste de ses contacts. Essayez par vous-même avec cette vidéo (de "Jacky") et, dans la barre d'adresse, effacez l'adresse internet de la vidéo et entrez la ligne de code suivante, puis validez : javascript:handlePickerClick(0);void(0); Vous devriez voir apparaitre la liste de vos contacts, dans le but de remplir plus facilement la partie "Envoyer par email" (le bouton bleu).
Bref, c'est à partir de cette fonction qu'Haochi Chen a découvert qu'un pirate pouvait, avec quelques lignes de code seulement, récupérer l'ensemble des adresses e-mail contenues dans votre liste de contacts Gmail.
Voici un petit exemple de ce que l'on peut faire avec quelques lignes de codes seulement :
Le fichier coupable de cette faille est présent sur de nombreux sous-domaines de Google (video, mail, docs, ...). La faille a d'ores et déjà été corrigée par des Googlers (qui travaillent le 1er janvier), mais pas sur tous les sous-domaines !
Impossible de vous prémunir de cette faille si vous avez un compte Gmail, à moins de désactiver Javascript et/ou vous déconnecter de votre compte Google... D'ici là, gardez l'oeil ouvert.