Le système de production et d'information hors norme de Google

 Le système de production et d'information hors norme de GoogleLorsqu'une entreprise atteint une certaine dimension, elle se doit d'avoir un système de production possédant la capacité nécessaire de traiter de grandes quantités d'informations. De plus, dans un monde où les vols de brevets et les copies sont fréquents, ces systèmes de productions se doivent d'être toujours plus innovants et performants. Google a su ainsi créer un système suffisamment puissant pour gérer des différents services avec la particularité qu'il ne peut être copié car il s'agit d'un des secrets les mieux gardés de la firme de Mountain View.

Le premier rack de serveurs de Google, aujourd?hui déjà au Computer History Museum.Les deux fondateurs de Google ont dû dès le départ faire face à la problématique de mettre en ligne une grande quantité d'informations afin d'optimiser le fonctionnement du moteur de recherche. Pour cela, et dès le début de l'aventure Google en 1998, Sergey Brin et Larry Page ont commencé par établir un premier réseau d'ordinateurs récupérés par ci par là. Cette provenance hétéroclite a eu un impact alors insoupçonné à ce moment-là et qui s'est révélé capital pour la suite de Google. Les ordinateurs ont commencé à tomber en panne les uns après les autres. Les deux fondateurs ont dû alors mettre au point un système de sauvegarde par redondance. En rajoutant des ordinateurs au réseau, le système risquait moins de tomber en panne et les pertes de données diminuaient. Petit à petit, le réseau a grossi et Larry et Sergey ont commencé à transférer leur réseau sur des serveurs contenus dans des armoires mobiles. Pourquoi mobiles ? Tout simplement parce qu'une fois avoir trouvé une solution au problème de la perte de données, il s'est présenté le problème de disponibilité de ces mêmes données dépendantes du réseau électrique et plus particulièrement des coupures de courant très fréquentes en Californie encore à cette époque. En prévoyant des armoires de serveurs mobiles, ils pouvaient ainsi commencer à s'installer dans d'autres Etats afin de fournir sauvegarde et disponibilité des données.

Au fur et à mesure que le réseau grossissait, il a fallu concevoir un logiciel capable de gérer cette distribution des données de plus en plus complexe. Cette étape est aussi importante que compliquée. Même si beaucoup de solutions existaient déjà à l'époque, les deux fondateurs ont décidé d'innover encore une fois en employant un médecin ! Ce neurochirurgien, Jim Reese (actuel Chief Operations Engineer chez Google), familier avec le monde de l'informatique a été embauché pour concevoir avec une équipe une solution de gestion des données distribuées en se basant sur le modèle du cerveau humain et de ses réseaux de neurones complexes et terriblement efficaces qui constituent notre mémoire.

Datacenter Google en Oregon (grand comme 2terrains de foot) présenté sur ZorgloobIl en découla ce fameux secret le mieux gardé de Google après sûrement ses algorithmes de recherche : une application interne capable de manière complètement automatisée de gérer tout le réseau de Google. Celle-ci a plusieurs fonctions tout aussi développées et essentielles les unes que les autres. Premièrement, elle se doit de sécuriser le réseau en cas d'indisponibilité d'une partie du réseau pour maintenance ou à cause d'un incident. En répartissant les requêtes du monde entier, l'application permet de manière complètement transparente pour l'utilisateur de fournir le même service quel que soit l'instant et la provenance de la requête. Ensuite et afin de sécuriser les données, elle fait en sorte que les mêmes données soient présentes sur plusieurs machines situées dans différents lieux au même instant. Dans le cas où une machine s'arrête et qu'elle ne redémarre pas, toutes les données présentes sur les autres machines sont à leur tour recopiées sur d'autres machines en d'autres endroits. La probabilité de perdre une seule donnée et alors complètement nulle. Impressionnant ! Enfin, cette application gère la répartition des unités de calcul disponibles pour le développement et la production internes de Google.

Grâce à cette application qui gère à elle seule entre 30 et 60 fermes de serveurs (environ 450 000 ordinateurs mais personne ne connaît le chiffre exact), Google a su mettre au point un formidable outil de production qui a également été développé pour réduire les coûts en gérant au plus près le parc informatique par rapport à la demande qui est faite en temps réel.

Article rédigé par Aysoon (Aysoon.com), Contributeur Zorgloob.

# Suberbe article, bravo !
Si ce n'est la petite faute de frappe : (ce fameux secret le mieux garder de Google)
bravo !

Ecrit par Blogger Julien le 15 février 2007 20:39  
# elle se doit de posséder un système de production possédant la capacité nécessaire

-> dommage, deux fois le meme verbe dans la premiere phrase, c est un peu indigeste ...
Bonne continuation !

Ecrit par Anonymous Anonyme le 15 février 2007 20:43  
# Bravo pour ce bon article, au contenu intéressant.

Malheureusement, vous oubliez -comme beaucoup trop de monde sur internet aujourd'hui- de vous relire ou de vous faire corriger par une personne qui sache écrire Français.

Ecrit par Anonymous Greg le 15 février 2007 21:08  
# Il n'y a plus de fautes d'orthographe dans l'article... Rangez vos fusils...
Aysoon n'y est pour rien, c'est de ma faute...
Merde, vous pourriez être discrets et me faire vos réflexions en PM sans poster des commentaires qui laissent supposer que nous faisons quelques petites erreurs de temps en temps...
Tout le monde va le savoir maintenant...

Concentrez-vous désormais sur le fond...

Ecrit par Blogger Kendos le 15 février 2007 21:33  
# enfin un article de fond dans la machine Google.
il en faut plus de ce genre.
bravo

Ecrit par Blogger lepit le 15 février 2007 22:50  
# désolé de te contredire,

"La probabilité de perdre une seule donnée est alors complètement nulle."

Sinon, très bon article.

Continuez !

Ecrit par Blogger Mick le 16 février 2007 02:19  
# Vraiment excellent cet article ! bravo

Ecrit par Blogger Sporcast le 16 février 2007 08:42  
# effectivemlent il faudrait plu dartciles comme celui-ci sur le fonctionnement de google, cest tres interessant
merci de lavoir ecrit et publié

Ecrit par Blogger kamaradclimber le 16 février 2007 12:46  
# Magnifique !

Ecrit par Blogger SiM07 le 16 février 2007 13:20  
# Très très intéressant, merci

Ecrit par Blogger Romuald le 16 février 2007 14:18  
# Bon article : )

D'où viennent vos infos svp ?

Ecrit par Anonymous darialalala le 16 février 2007 19:28  
# Je tiens à m'excuser tout d'abord pour les fautes d'orthographe qui se sont glissées dans l'article.. je ne sais pas du tout comment elles sont arrivées là ^_^ Je serai plus vigilant à l'avenir !
Pour ce qui est de mes sources, elles sont variées. Je me documente depuis quelques mois sur cette formidable aventure technologique et managériale qu'est Google. Après pas mal de lectures, je commence à voir certains points plus précisément et j'essaye de vous les faire découvrir à mon tour... Et je suis content de rencontrer un si bon accueil...

Ecrit par Blogger aysoon le 16 février 2007 19:48  
# A noter que ces infos de production sont en fait de deux ordres bien différents:
1 - les données d'indexation du web, pour lesquelles les archives sont volumineuses, mais qui supportent à tout moment que l'on perde "la dernière demi-journée", puisqu'il suffit de crawler pour la reconstituer; donc elles DOIVENT être archivées, mais on PEUT en perdre de "fraîches" sans problème particulier.
2 - Les vraies données de production, celles qui contribuent directement à générer de l'argent: les pubs, leurs clics, les données "analytics", etc. Pour ces données, il n'est pas question d'en perdre trop, et c'est là où la redondance joue un rôle primordial.
Pour prendre un parallèle technique, disons que les données prod/argent ont correspondent au TCP/IP qui garantit que l'on ne peut pas perdre le moindre bit, quel que soit le temps que cela prend, comparé à l'UDP/IP où la constance du flux est primordiale, même si l'on perd deci-delà quelques bits (un mot de VOIP, 3 notes de musique, ou une image TV).

Ecrit par Blogger Fibo le 17 février 2007 00:00  
# excellent tres instructif.

Ecrit par Blogger Laurent le 17 février 2007 09:55  
Cherchez sur Zorgloob :
Ils nous font confiance :
Florajet
Spécialiste de la monétisation d'audience
Creation Site Internet


Votre
publicité
ici...

+ de 2 200 articles sur Google :
Au programme ce jour :

Tous les articles Zorgloob 2008
(2007 - 2006 - 2005 - 2004)
Le Grand Jeu Zorgloob
Les Blogs Google
Les Logos Google 2007
Vos logos Google
Zorgloob Maps
Soumettre un article

Le Casting Zorgloob :

Clicquez pour agrandir Kendos Eric Lebeau (Kendos)
Clicquez pour agrandir TomHtml TomHtml (TOMHTML)
Clicquez pour agrandir Luka Jérémy Milhau (Luka)
Clicquez pour agrandir FJ Frère Jacques (FJ)

Ils ont contribué :

David Herrgott, Sylvain Briant, Lifetec, Romain Boyer, Cédric Magnin, Cyril Slucki, Mael Le Hir, Alexis Berger, Stéphane Rangaya, Patrick Tacchini, Etienne Deparis, Bertrand Pautrot

Si vous avez des actions Google :

Clicquez pour agrandir

Nos records de fréquentation :

40 665 visites/jour
94 511 pages vues/jour
Clicquez pour agrandir les Stats
566 512 visites (Mars 2008)
1 391 395 pages vues (Janvier 2008)

Allez y de notre part :

Zuneo
Webrankinfo
Google Blogoscoped
Google Operating System
Google Watch Blog
Googlified