Une page n’a pas de flux RSS pour suivre ses modifications ? Google Reader le crée pour vous !
De nos jours, l’information se crée et se propage à une vitesse phénoménale, et il semble de plus en plus indispensable de se tenir informé. Que ce soit dans une entreprise de haute technologie ou dans la rédaction d’un journal people, l’information a un rôle clé et être le premier à l’obtenir devient stratégique. Comme disait Francis Bacon : le savoir, c’est le pouvoir. Imaginez qu’il y a 100 ans lorsqu’une catastrophe se produisait à l’autre bout de l’Europe, il fallait parfois plusieurs jours pour voir l’information être publiée dans les quotidiens. Aujourd’hui, une telle latence serait inacceptable et c’est le temps-réel qui prime. Par conséquent, lorsqu’un avion s’écrase au Liban vous pouvez en être informé dans la minute grâce à Twitter et d’autres canaux.
Encore faut-il pouvoir récupérer toutes ces informations ! Pour palier le problème de la recherche perpétuelle d’informations sur les mêmes sites internet, il existe les flux RSS*. Ou ATOM, c’est au choix. Vous pouvez utiliser votre navigateur ou certains agrégateurs comme Netvibes ou Google Reader pour consulter ces messages qui listent les nouvelles publications des sites auxquels vous vous êtes abonnés. C’est un outil indispensable pour la veille technologique – à titre d’information, pour vous fournir des nouvelles fraîches et/ou croustillantes relatives à Google, votre fidèle serviteur suit près de 500 flux qui accouchent de 13000 messages par mois; imaginez le temps qui aurait été perdu si j’avais du consulter ces 500 sites plusieurs fois par jour ! Toutefois, tous les sites ne proposent pas de flux RSS, ou pas toujours pour une page donnée.
Ce soir, l’équipe de Google Reader vient d’annoncer que son application était capable de créer des flux RSS à la volée. En clair, si vous souhaitez suivre les modification d’une page qui ne propose pas de flux RSS (comme le fichier robots.txt de Google par exemple) il vous suffit d’ajouter l’URL de la page comme si vous ajoutiez à abonnement, et Google Reader va vous proposer la création d’un flux.
À l’heure actuelle, on ne sait pas encore la fréquence d’actualisation de ces flux créés – toutes les heures, tous les jours ou toutes les semaines ? C’est là que réside le principal problème pour les veilleurs technologique, mais cela ne devrait pas vous poser de problème si vous n’êtes pas pressés par le temps. Le robot de Google Reader semble être directement Googlebot, le travail serait ainsi mutualisé mais cela signifie également que les pages « secrètes » que vous surveillez pourront se retrouver indexées ! Les pages protégées par un système d’authentification ne sont pas supportées, indique l’aide en ligne.
La firme californienne fait ainsi concurrence au très performant Page2RSS et à ses concurrents précédents que sont Feedity et Feed43, tous spécialistes du tracking de modifications sur des pages web. Il existe également une extension de Google Chrome nommée Page Monitor, qui a le mérite d’être la plus rapide (c’est votre ordinateur qui vérifie les changements automatiquement à un intervalle que vous pouvez fixer) mais qui ne permet pas de connaître les différences constatées sur une page donnée.
Reste qu’une fois toutes les informations obtenues, il faut les décrypter, les analyser, les synthétiser, les critiquer si besoin est. Et ça, aucun outil n’est capable de le faire. Pour l’instant.
Édition du 27 janvier : l’exemple du fichier robots.txt est un mauvais exemple puisque seules les pages au format HTML sont acceptées, force est de constater que le robots.txt n’en est pas un… Toutes nos excuses pour ce malentendu.
(*) Zorgloob.com dispose de son flux RSS auquel nous vous invitons à vous abonner.

Articles
L'équipe
Twitter
Forum
Logiciels
City
Live !
Contact






















