Le 21 juillet 2008

Google comparé à des grains de riz…


Google borne Cet article résulte de la traduction d’un billet posté sur le blog de la compagnie britannique « Managed Networks« . En partant d’une simple comparaison, il permet de réaliser à quel point les données manipulées par le géant de la recherche sont immense…

La blogosphère était ébahie au début de l’année quand elle a réalisé quelle était la véritable taille de Google. Vous pensiez que Google était le King Kong de la recherche ? Imaginez un million de King Kong et vous vous approcherez de la vérité. Vérifiez par vous-mêmes.

La taille d’un fichier MP3 est d’environ 3 mégaoctets. Les Beatles ont enregistré 214 singles, ce qui s’approche à peine d’un gigaoctet. 1024 gigaoctets font un téraoctet et 1024 téraoctets font un pétaoctet. Vous êtes perdus ? Nous l’étions aussi.

Nos pauvres esprits n’avaient pas été aussi époustouflés par de tels nombres depuis qu’un farceur légendaire avait berné ses ainés en utilisant un échiquier il y a quelques centaines d’années. Nous avons utilisé la même unité de mesure – des grains de riz – pour essayer de mettre en perspective la puissance du cerveau électronique de Google.

Disons qu’un grain de riz est octet. Un octet est composé de 8 chiffres binaires, comme « 10011000 » par exemple. Il peut aussi être décrit par 2 caractères hexadécimaux. En termes de données, un octet est généralement utilisé pour enregistrer une simple lettre. Un octet = une lettre = un grain de riz.

1 grain de riz

En gardant cette nouvelle représentation en tête, nous pouvons maintenant voir un kilo-octet (1024 octets) comme un petit bol de riz. C’est environ une demi-portion, pas assez pour vous nourrir. En termes de données, 1 Ko pourrait contenir à peine une poignée de paragraphes d’un texte. Ce n’est pas non plus assez pour vous stimuler mentalement.

1 bol de riz

L’étape suivante est le mégaoctet, qui est de l’ordre de la taille complète moyenne d’un texte sur un site internet, ou de celle d’un petit roman. A l’échelle du riz, un mégaoctet représenterait un sac de 25 kg de riz. Suffisant pour nourrir 420 personnes à table, en supposant que vous ayez assez de chaises.

1 sac de riz

1024 fois plus grand vient le gigaoctet. En 1995, quand on achetait un PC avec un disque dur d’1 Go, on pouvait enregistrer tout ce que l’on souhaitait dessus pour au moins quelques années.

Pour stocker 1 Go de riz, on a besoin d’un jardin bien plus grand… de la taille de deux containers pour être plus précis. De quoi alimenter convenablement beaucoup de monde… Trouver un simple mot dans un gigaoctet de texte revient à trouver quelques grains de riz en particulier cachés dans deux de ces containers. Ça tient de l’impossible pour un humain, et pourtant vous n’avez encore rien vu. Lisez donc la suite.

1 container de riz

Changeons encore d’échelle et atteignons le téraoctet, l’équivalent de 1024 gigaoctets. Certains d’entre-vous ont peut-être un disque dur d’1 To dans leur machine. Cela reste petit, mais rechercher quelque-chose parmi tout le contenu du disque dur, même sur un puissant ordinateur, prend beaucoup plus de temps que votre patience ne pourrait en supporter.

Pour transporter un téraoctet de riz, vous devriez louer un énorme porte-containers. On pourrait utiliser son chargement pour nourir tout le monde dans l’Union Européenne.

1 porte-container de riz

Enfin, nous arrivons au fameux pétaoctet. À cette étape, nous sommes au-delà de la taille de données que la plupart des individus ou des petites entreprises peuvent gérer, et nous entrons dans la catégorie nettement supérieure. C’est comme gérer le contenu des 210 des plus gros porte-containers aux monde. QUATRE-VINGT bols de riz pour chaque personne sur cette planète, ou, d’un autre point de vue…

Londres sous un metre de riz

… suffisamment de riz pour couvrir le centre de Londres sous un mètre de riz !

Sachez maintenant que Google traite 20 pétaoctets de données tous les jours; ou si vous préférez, 4000 de ces super-porte-containers bondés de riz, 1600 bols pour chaque terrien, ou recouvrir Londres sous 20 mètres de riz. Cette action est effectuée par 72000 processus qui se déroulent chacun en moyenne 7 minutes. Leur capacité de traitement des données est ce qui fait que Google est un top des entreprises du monde virtuel (et du monde réel), et on ne doute plus que Google doive payer une facture d’électricité de deux millions de dollars chaque mois, selon des estimations.

Au final, une recherche sur Google (autrement dit, trouver quelques grains de riz dans des milliers de porte-containers) prend en moyenne moins d’une seconde…

D’après « I never knew Google was THIS massive!« , un billet posté sur le blog de Managed Networks. Les images appartiennent également à Managed Networks.

Publié le 21 juillet 2008 à 12:11 par dans Actualité

Billet trop ancien. Les commentaires sont maintenant fermés.