Le 30 avril 2012

L’affaire des voitures Google : bien plus qu’une simple erreur, la firme savait !


L’affaire des voitures Google : bien plus qu’une simple erreur, la firme savait !

L’an passé, Google a été lourdement condamné pour avoir collecté illégalement pendant trois ans des données wifi personnelles dans le cadre du projet Street View. Ce problème aurait pu être évité…

Jusqu’à présent, les annonces de Google et les audits de la FCC (Commission fédérale des communications, la version américaine de la CNIL enquêtant sur l’affaire) nous laissaient entendre que le scandale qui a éclaté en 2010 autour des voitures de Google Street View avait pour origine une erreur de programmation. Un simple fichier de configuration non modifié et quelques basiques lignes de code avaient eu pour conséquence l’interception, par Google, de données privées diffusées sur les réseaux wifi non-sécurisés. C’est dans un data center de l’Oregon qu’étaient ainsi stockées des bribes de données wifi, capturées et enregistrées sans autorisation, et qui permettaient à ceux qui y avait accès de découvrir une montagne de secrets. Comme la preuve de relations extra-conjugales dans le sud de la France ou le carnet de santé de patients d’une clinique de Saint-Étienne.

Toutefois, un nouveau rapport de la FCC, d’abord diffusé sous sa version censurée puis en version (presque) complète, apporte un regard nouveau sur cette affaire. Contrairement à ce qui a été affirmé, certains employés de Google étaient bien au courant de ce que capturaient réellement les véhicules de Google, mais ils ont été ignorés par leur hiérarchie et leurs collègues. La firme a freiné au maximum le travail de la FCC, en ne divulguant ses documents qu’au compte-goutte, elle vient d’être condamnée pour cela.

Voici en détail le déroulement des faits d’après le rapport de la commission :

  1. Pour créer le programme embarqué dans chaque voiture Google, celui qui associe une point d’accès sans fil à des coordonnées GPS, Google a fait appel en 2006 à l’un de ses employés. Le nom de cet ingénieur n’a pas été rendu public, nous l’appellerons Jean Porte-Poisse. Jean ne fait pas partie de l’équipe Street View composée d’une huitaine d’ingénieurs. Il ne s’agit pour lui que d’un « projet 20% ». C’est lui qui prend l’initiative d’enregistrer volontairement toutes les données que l’antenne capte, parce qu’il pense que ça pourrait être utile pour d’autres services de la firme.
  2. Jean teste son programme et consulte les données collectées. Il estime qu’extraire de ces données les URLs qui ont été consultées par les utilisateurs à proximité des voitures pourrait être intéressant pour d’autres ingénieurs. Il s’adresse à un membre de l’équipe Recherche Qualité, qui lui répond que ces informations n’ont pas de valeur. Jean abandonne alors cette idée.
  3. Une fois son travail terminé, Jean rédige et envoie le 26 octobre 2006 une documentation technique listant tous les aspects, matériels et logiciels, de son travail. Dans la partie « Considération sur la vie privée », il écrit « l’un des problèmes pourrait concerner le fait que nous enregistrons le trafic des utilisateurs, avec suffisamment de données pour trianguler précisément leur position à un moment donné, ainsi que les informations sur ce qu’ils sont en train de faire. » L’ingénieur a identifié ce problème mais a considéré qu’il n’était pas important parce que les « voitures de Street View ne seront pas à proximité des utilisateurs pour un bon moment encore » et parce que « aucune des informations collectées ne pourra être présentée aux utilisateurs dans leur forme brute ». Néanmoins, en bon développeur, Jean ajoute à son document un « TODO » (à faire) : « Discuter des réflexions concernant la vie privée avec le conseiller juridique dédié aux produits ». Les développeurs savent ce qui arrive généralement aux TODO… Ici, la discussion n’a finalement jamais eu lieu.
  4. L’enquête a révélé qu’aucun des membres de l’équipe Google Street View n’a réellement lu la documentation. Et ceux qui l’ont survolée n’ont pas souvenir d’avoir lu quelque-chose concernant le fait que toutes les données étaient enregistrées. Pire : l’un des managers a confirmé avoir pré-approuvé le document avant même le début de sa rédaction.
  5. En 2007, un autre ingénieur est amené à vérifier et déboguer le code écrit par Jean. Par pure coïncidence, le bureau de cet ingénieur est situé juste à côté de celui de Jean. Malgré le fait que le code ait été entièrement relu – et, en outre, réindenté – l’ingénieur n’a pas remarqué que le programme enregistrait le corps des paquets captés.
  6. Par la suite, au moins cinq membres de l’équipe Street View ont été amenées à tester et corriger le code de Jean. Malgré quelques échanges par e-mail avec lui, à aucun moment il n’a été fait mention des données personnelles.
  7. En mai 2008, Jean échange des e-mails avec un ingénieur du projet Street View. Il lui explique que le corps des trames non-chiffrées est bien enregistré et que l’une de ses tâches en attente est de déterminer combien de requêtes HTTP sont collectées. Quatre jours plus tard il résume au chef de projet : « Sur 300 millions de paquets, il y a 70000 requêtes HTTP pour 32000 adresses internet uniques. Pas vraiment beaucoup ». La suite des mails confirme que ces données ne valent rien aux yeux de ces personnes.
  8. Lors d’une discussion qui s’est tenue entre 2007 et 2008, Jean Porte-Poisse affirme avoir averti deux membres de l’équipe, dont un chef de projet, quant à la nature des informations enregistrées. Aujourd’hui encore, ces deux personnes affirment ne pas avoir été au courant de ce problème avant que le scandale éclate…
  9. Entre janvier 2008 et avril 2010, ce logiciel équipait les voitures de Google et a collecté plus de 200 Go de données provenant des réseaux non-sécurisés, rien qu’aux États-Unis.
  10. En avril 2010, le scandale éclate. La France, le Canada et les Pays-Bas étudient le contenu des disques durs de quelques voitures et en viennent à la même conclusion : le nombre d’informations sensibles, comme des logs de conversations en ligne ou des extraits de dossiers médicaux, est très important. Et très inquiétant.
  11. Google fait son mea culpa, met la faute sur le dos de ce pauvre Jean Porte-Poisse, stoppe ses voitures et modifie le code du logiciel pour cesser d’enregistrer ces informations, ce que confirmera un expert indépendant par la suite.

La firme de Mountain View affirme dans le rapport que les données brutes collectées n’ont été consultées qu’à deux reprises : en 2008 par l’ingénieur qui a créé le programme pour savoir si ces données pouvaient être utiles, et en 2010 par un chef de projet pour confirmer les soupçons des enquêteurs concernant la collecte de ces paquets wifi.

En conclusion de ce rapport, la Commission confirme que Google n’a pas violé la loi. Toutefois, l’entreprise est condamnée pour avoir délibérément bloqué l’enquête à de multiples reprises. L’un des exemples les plus frappants est quand la FCC a demandé à Google tous les documents, y compris les e-mails, sur lesquels s’était basée la firme de Mountain View pour ses précédentes réponses. Google a alors répondu qu’elle avait décidé de « ne pas entreprendre une examen complet des e-mails ou d’autres communications électroniques [car] ce serait un travail trop lourd et pesant ». Un comble pour le spécialiste mondial de la recherche.

Dans un communiqué envoyé à l’agence Reuters, Google se veut rassurant. « Bien que nous sommes en désaccord avec certaines des déclarations faites dans le document, nous sommes d’accord avec la conclusion de la FCC que nous n’avons pas enfreint la loi. Nous espérons que nous pouvons maintenant mettre cette affaire derrière nous. » Cette affaire, comme d’autres dans une moindre mesure, a pourtant lourdement terni l’image de Google en matière de protection de la vie privée. Et il est certain qu’on en parlera encore à chaque prochain scandale impliquant le géant californien…

Mise à jour du 1er mai : le New York Times affirme avoir découvert l’identité de l’ingénieur à l’origine de toute cette affaire, alias Jean Porte-Poisse dans notre récit ci-dessus. Il s’agirait de Marius Milner, un spécialiste du wifi qui travaille pour Google depuis 2003 et qui avait auparavant créé un logiciel dédié au wardriving…

Publié le 30 avril 2012 à 1:50 par dans Justice

Labels : ,

5 commentaires

  1. Savez-vous si ce billet http://www.nytimes.com/2012/04/29/technology/google-engineer-told-others-of-data-collection-fcc-report-reveals.html est ou sera traduit en français ?

    Je pense qu’il mérite le « détour ».

  2. TOMHTML a dit :

    Cet article du NYT est basé sur le même rapport à première vue, donc tout ce qui y est écrit est normalement présent dans l’article que nous avons rédigé ci-dessus.

  3. [...] pas vraiment lu le document de recherche avant de l’approuver. Pour plus de détails, consulter le blogue de Zorgloob ou le New York [...]

    Backlink
  4. [...] fonctionnement de Google  : blogs, reportages au Googleplex, publication d’audits en cas de graves scandales, le Transparency Report, … Même le fameux algorithme a droit à ses bribes de transparence. [...]

    Backlink
  5. Algéri info a dit :

    c’est une violation de la vie privée, on peut maintenant deviner ce que fait google avec nos données qu’il recueil.

    il y en a mare