Comment corrompre le dictionnaire de Google

Google booksQuelques astuces pour s'amuser avec un opérateur méconnu de Google...

Il existe un opérateur du moteur de recherche Google qui est trop peu connu, et pourtant bien amusant. Cet opérateur, c'est "define:". Il permet de rechercher des définitions de mots et d'expressions.

Par exemple, la requête "define:HTML" vous donnera différentes définitions de ce termes, issues de nombreuses sources. Pour beaucoup de mots, c'est Wikipédia et le Wiktionnaire qui servent de source pour la principale définition. Lorsque vous recherchez juste "définition HTML" dans Google, c'est la première définition de la liste qui est affichée dans une onebox. Ces définitions sont disponibles en plusieurs langues, notamment en français depuis 3 ans.

En 2005, le professeur Jean Véronis et moi-même nous amusions de quelques définitions. L'algorithme de Google semble en effet incapable de faire la différence entre des définitions sérieuses et celles plus humoristiques. Exemple, la première définition du mot "femme" était "Personne de sexe féminin. Autrefois la femme servait à transporter de l'eau au moyen d'énormes cruches qu'elle tenait gracieusement en équilibre sur sa tête en ondoyant harmonieusement les hanches. Depuis l'invention des robinets, son statut est sérieusement remis en cause"... On trouve également des bugs, comme cette définition du sigle W3C.

J'avais alors réalisé une page contenant des définitions plus ou moins loufoques. Malgré de nombreux passage de Googlebot sur cette page, aucune des définitions n'était présente dans Google Define. Jusqu'à il y a peu.

Google Define Zorgloob

Toutes les définitions contenues dans cette page, qui n'a pas été modifiée depuis 3 ans, sont maintenant présentes dans le dictionnaire de Google. Essayez avec Jean Véronis (pur les fans d'Aixtal), Nouveauté (pour nos amis Googlers), Gromanche (pour nos amis du Groland) ou encore TOMHTML (pour les amis de Zorgloob).

Alors, voici ce qu'il vous faut pour que vous puissiez, vous aussi, vous amuser avec le numéro 1 mondial (quasi ex-aequo) de la recherche en ligne.
  • Une page dédiée aux définitions, avec beaucoup de définitions;
  • Faites des descriptions ni trop longues, ni trop petites : une vingtaine de mots en moyenne;
  • Si vous souhaitez à tout prix apparaître en tant que "onebox", choisissez des mots et expressions pour lesquelles il n'y a pas encore de définitions;
  • Cette page doit être optimisée syntaxiquement : vous pouvez utiliser les balises de définition DD, DL et DT, mais cela n'est pas obligatoire. L'important étant de garder partout la même syntaxe HTML pour bien séparer la définition du mot défini, en prenant soit de mettre en valeur ce dernier;
  • Faites comprendre à Google que cette page est un lexique, un dictionnaire, là où il pourra piocher des informations pour son dictionnaire. Pour cela, remplissez votre page de mots relatifs aux dictionnaires et définitions. N'hésitez pas à y balancer tous le thésaurus et dictionnaire des synonymes pour les mots "dictionnaire", "lexique", "glossaire", ...;
  • Choisissez également un tel mot pour le nom de votre fichier : definitions.html par exemple. Ce point est sans doute le plus important;
  • Dans le même genre, il faut que Google considère votre page "digne de qualité". Autrement dit, hébergez la sur un site ayant un PageRank un tant soit peu important, et faites de nombreux liens de part le web vers cette page, en utilisant encore une fois des mots de l'univers des définitions pour vos liens;
  • Patientez. Oui, ça ne se fait pas du jour au lendemain.
Si vous avez d'autres astuces, n'hésitez pas à nous les communiquer en nous laissant un commentaire !

Merci, Google Define :-)

Édition du 9 juin : ça y est, visiblement il y a au moins une personne en charge de la qualité chez Google qui a découvert nos âneries. Conclusion, toutes les définitions extraites de mon fichier de définitions ont été retirées... Dommage, ça en amusait plus d'un :-)
[Merci Thibaut !]

# Bravo Tom !

Dis-moi, tu crois qu'elle va tenir combien de temps cette définition ?

On va voir le délai pour que ça passe en "Human Rating" et que la OneBox disparaisse...

Ecrit par Blogger Kendos le 28 mai 2008 19:58  
# Je ne sais pas si beaucoup de quality raters s'amusent à vérifier mes quelques définitions.
Mais on verra bien, l'important, c'est la capture d'écran :-)

Ecrit par Blogger TOMHTML le 28 mai 2008 20:04  
# excellentissime article

Ecrit par Blogger maXou le 29 mai 2008 06:23  
# Vraiment bien joué TOMHTML.

Kendos : y a du temps vu que les définitions de femmes n'ont toujours pas changé ;)

Ecrit par Blogger Grand Koala le 29 mai 2008 07:24  
# P.S. : Logo Google Everest

Ecrit par Blogger Grand Koala le 29 mai 2008 07:25  
# Bravo ! J'aime beaucoup la définition de TOMHTML ;)

Ecrit par Anonymous Rapport de stage le 29 mai 2008 09:12  
# Personne qui dit que ca lui fait peur qu'on puisse manipuler le dictionnaire google si simplement et que les définitions perdurent dans le temps ????

Bande d'inconscients va ;)

Ecrit par Anonymous Mickael le 29 mai 2008 20:24  
# Tiens, Iznogoud :D Même lui est passé ^_^

Ecrit par Blogger Morgan le 30 mai 2008 09:09  
Cherchez sur Zorgloob :
Ils nous font confiance :
Florajet
Spécialiste de la monétisation d'audience


Votre
publicité
ici...

+ de 2 200 articles sur Google :
Au programme ce jour :

Tous les articles Zorgloob 2008
(2007 - 2006 - 2005 - 2004)
Le Grand Jeu Zorgloob
Les Blogs Google
Les Logos Google 2007
Vos logos Google
Zorgloob Maps
Soumettre un article

Le Casting Zorgloob :

Clicquez pour agrandir Kendos Eric Lebeau (Kendos)
Clicquez pour agrandir TomHtml TomHtml (TOMHTML)
Clicquez pour agrandir Luka Jérémy Milhau (Luka)
Clicquez pour agrandir FJ Frère Jacques (FJ)

Ils ont contribué :

David Herrgott, Sylvain Briant, Lifetec, Romain Boyer, Cédric Magnin, Cyril Slucki, Mael Le Hir, Alexis Berger, Stéphane Rangaya, Patrick Tacchini, Etienne Deparis, Bertrand Pautrot

Si vous avez des actions Google :

Clicquez pour agrandir

Nos records de fréquentation :

40 665 visites/jour
94 511 pages vues/jour
Clicquez pour agrandir les Stats
566 512 visites (Mars 2008)
1 391 395 pages vues (Janvier 2008)

Allez y de notre part :

Zuneo
Webrankinfo
Google Blogoscoped
Google Operating System
Google Watch Blog
Googlified