Le 28 mai 2008

Comment corrompre le dictionnaire de Google


Google booksQuelques astuces pour s’amuser avec un opérateur méconnu de Google…

Il existe un opérateur du moteur de recherche Google qui est trop peu connu, et pourtant bien amusant. Cet opérateur, c’est « define:« . Il permet de rechercher des définitions de mots et d’expressions.

Par exemple, la requête « define:HTML » vous donnera différentes définitions de ce termes, issues de nombreuses sources. Pour beaucoup de mots, c’est Wikipédia et le Wiktionnaire qui servent de source pour la principale définition. Lorsque vous recherchez juste « définition HTML » dans Google, c’est la première définition de la liste qui est affichée dans une onebox. Ces définitions sont disponibles en plusieurs langues, notamment en français depuis 3 ans.

En 2005, le professeur Jean Véronis et moi-même nous amusions de quelques définitions. L’algorithme de Google semble en effet incapable de faire la différence entre des définitions sérieuses et celles plus humoristiques. Exemple, la première définition du mot « femme » était « Personne de sexe féminin. Autrefois la femme servait à transporter de l’eau au moyen d’énormes cruches qu’elle tenait gracieusement en équilibre sur sa tête en ondoyant harmonieusement les hanches. Depuis l’invention des robinets, son statut est sérieusement remis en cause« … On trouve également des bugs, comme cette définition du sigle W3C.

J’avais alors réalisé une page contenant des définitions plus ou moins loufoques. Malgré de nombreux passage de Googlebot sur cette page, aucune des définitions n’était présente dans Google Define. Jusqu’à il y a peu.

Google Define Zorgloob

Toutes les définitions contenues dans cette page, qui n’a pas été modifiée depuis 3 ans, sont maintenant présentes dans le dictionnaire de Google. Essayez avec Jean Véronis (pur les fans d’Aixtal), Nouveauté (pour nos amis Googlers), Gromanche (pour nos amis du Groland) ou encore TOMHTML (pour les amis de Zorgloob).

Alors, voici ce qu’il vous faut pour que vous puissiez, vous aussi, vous amuser avec le numéro 1 mondial (quasi ex-aequo) de la recherche en ligne.

  • Une page dédiée aux définitions, avec beaucoup de définitions;
  • Faites des descriptions ni trop longues, ni trop petites : une vingtaine de mots en moyenne;
  • Si vous souhaitez à tout prix apparaître en tant que « onebox », choisissez des mots et expressions pour lesquelles il n’y a pas encore de définitions;
  • Cette page doit être optimisée syntaxiquement : vous pouvez utiliser les balises de définition DD, DL et DT, mais cela n’est pas obligatoire. L’important étant de garder partout la même syntaxe HTML pour bien séparer la définition du mot défini, en prenant soit de mettre en valeur ce dernier;
  • Faites comprendre à Google que cette page est un lexique, un dictionnaire, là où il pourra piocher des informations pour son dictionnaire. Pour cela, remplissez votre page de mots relatifs aux dictionnaires et définitions. N’hésitez pas à y balancer tous le thésaurus et dictionnaire des synonymes pour les mots « dictionnaire », « lexique », « glossaire », …;
  • Choisissez également un tel mot pour le nom de votre fichier : definitions.html par exemple. Ce point est sans doute le plus important;
  • Dans le même genre, il faut que Google considère votre page « digne de qualité ». Autrement dit, hébergez la sur un site ayant un PageRank un tant soit peu important, et faites de nombreux liens de part le web vers cette page, en utilisant encore une fois des mots de l’univers des définitions pour vos liens;
  • Patientez. Oui, ça ne se fait pas du jour au lendemain.

Si vous avez d’autres astuces, n’hésitez pas à nous les communiquer en nous laissant un commentaire !

Merci, Google Define 🙂

Édition du 9 juin : ça y est, visiblement il y a au moins une personne en charge de la qualité chez Google qui a découvert nos âneries. Conclusion, toutes les définitions extraites de mon fichier de définitions ont été retirées… Dommage, ça en amusait plus d’un 🙂
[Merci Thibaut !]

Publié le 28 mai 2008 à 17:54 par dans Actualité

1 commentaire

  1. j’aimerais bien savoir parler et écrire en français et en anglais