Le 26 janvier 2010

Google Reader surveille les modifications d’une page, même sans flux RSS


Google Reader surveille les modifications d’une page, même sans flux RSS

Une page n’a pas de flux RSS pour suivre ses modifications ? Google Reader le crée pour vous !

De nos jours, l’information se crée et se propage à une vitesse phénoménale, et il semble de plus en plus indispensable de se tenir informé. Que ce soit dans une entreprise de haute technologie ou dans la rédaction d’un journal people, l’information a un rôle clé et être le premier à l’obtenir devient stratégique. Comme disait Francis Bacon : le savoir, c’est le pouvoir. Imaginez qu’il y a 100 ans lorsqu’une catastrophe se produisait à l’autre bout de l’Europe, il fallait parfois plusieurs jours pour voir l’information être publiée dans les quotidiens. Aujourd’hui, une telle latence serait inacceptable et c’est le temps-réel qui prime. Par conséquent, lorsqu’un avion s’écrase au Liban vous pouvez en être informé dans la minute grâce à Twitter et d’autres canaux.

Encore faut-il pouvoir récupérer toutes ces informations ! Pour palier le problème de la recherche perpétuelle d’informations sur les mêmes sites internet, il existe les flux RSS*. Ou ATOM, c’est au choix. Vous pouvez utiliser votre navigateur ou certains agrégateurs comme Netvibes ou Google Reader pour consulter ces messages qui listent les nouvelles publications des sites auxquels vous vous êtes abonnés. C’est un outil indispensable pour la veille technologique – à titre d’information, pour vous fournir des nouvelles fraîches et/ou croustillantes relatives à Google, votre fidèle serviteur suit près de 500 flux qui accouchent de 13000 messages par mois; imaginez le temps qui aurait été perdu si j’avais du consulter ces 500 sites plusieurs fois par jour ! Toutefois, tous les sites ne proposent pas de flux RSS, ou pas toujours pour une page donnée.

Ce soir, l’équipe de Google Reader vient d’annoncer que son application était capable de créer des flux RSS à la volée. En clair, si vous souhaitez suivre les modification d’une page qui ne propose pas de flux RSS (comme le fichier robots.txt de Google par exemple) il vous suffit d’ajouter l’URL de la page comme si vous ajoutiez à abonnement, et Google Reader va vous proposer la création d’un flux.

À l’heure actuelle, on ne sait pas encore la fréquence d’actualisation de ces flux créés – toutes les heures, tous les jours ou toutes les semaines ? C’est là que réside le principal problème pour les veilleurs technologique, mais cela ne devrait pas vous poser de problème si vous n’êtes pas pressés par le temps. Le robot de Google Reader semble être directement Googlebot, le travail serait ainsi mutualisé mais cela signifie également que les pages « secrètes » que vous surveillez pourront se retrouver indexées ! Les pages protégées par un système d’authentification ne sont pas supportées, indique l’aide en ligne.

La firme californienne fait ainsi concurrence au très performant Page2RSS et à ses concurrents précédents que sont Feedity et Feed43, tous spécialistes du tracking de modifications sur des pages web. Il existe également une extension de Google Chrome nommée Page Monitor, qui a le mérite d’être la plus rapide (c’est votre ordinateur qui vérifie les changements automatiquement à un intervalle que vous pouvez fixer) mais qui ne permet pas de connaître les différences constatées sur une page donnée.

Reste qu’une fois toutes les informations obtenues, il faut les décrypter, les analyser, les synthétiser, les critiquer si besoin est. Et ça, aucun outil n’est capable de le faire. Pour l’instant.

Édition du 27 janvier : l’exemple du fichier robots.txt est un mauvais exemple puisque seules les pages au format HTML sont acceptées, force est de constater que le robots.txt n’en est pas un… Toutes nos excuses pour ce malentendu.

(*) Zorgloob.com dispose de son flux RSS auquel nous vous invitons à vous abonner.

Publié le 26 janvier 2010 à 0:57 par dans Actualité

Labels : , , ,

14 commentaires

  1. pwetpwet a dit :

    cool, cette fonction.
    Mais j’aurais voulu la mettre en oeuvre sur une page spécifique d’un site pour lequel il y a déjà un flux rss général, pas possible de le court-circuiter ?

  2. TOMHTML a dit :

    Je n’ai pas trouvé, mais si quelqu’un a la solution je suis preneur !

  3. Tu fais comme si tu ajoutais un nouvel abonnement, par le bouton « ajouter un abonnement » en haut à gauche. Tu mets l’urls dans le champ, même si ce n’est pas un RSS. Tu cliques « ajouter », et il crée automatiquement le fil.

  4. Tchikito a dit :

    J’utilise déjà Google Reader et Zorgloob en fait partie ^^.
    Je viens d’essayer cette fonctionnalité avec une page d’Allociné, où ils ne sont apparemment pas décidés à proposer de flux RSS : http://www(dot)allocine(dot)fr/video/faux-raccords/
    Ça ne fonctionne pas. Aurais-je fais une erreur ?

    Merci d’avance TOMHTML pour le conseil avisé que tu pourras me donner (un peu de pommade ça fait pas de mal ^^)

  5. Mouss a dit :

    J’ai l’impression que ça ne marche que si on passe son compte en anglais…

  6. Tchikito a dit :

    Effectivement, en anglais ça marche. Je pense donc que cette fonctionnalité n’est pas encore disponible pour toutes les versions.
    Ceci dit, c’est une habitude chez Google ^^.

  7. Éric NIAKISSA a dit :

    C’est comme si Google Alert proposait des URLs à la place des expressions-clés !

  8. Philippe a dit :

    J’ai tenté le coup avec le site web de ma mucipalité qui n’offre pas de RSS et j’obtiens cette erreur quelques heures après avoir enregistré le « fil » :

    Google was not able to access this page to check for updates. This page may be unavailable or have other restrictions that prevent Google from getting updates.

  9. […] Plus d’info : http://www.zorgloob.com/2010-01/google-reader-surveille.. […]

    Backlink
  10. […] jours Google a répondu à ce point avec l’outil Google Reader. Voir l’article sur le site qui pourrait être l’intranet de google : Zoorglob. La fonctionnalité n’est actuellement disponible que pour la version anglaise de Google […]

    Backlink
  11. Katryne a dit :

    Je n’y arrive pas même avec la version anglaise: si un fil rss existe déjà sur une page du site, c’est toujours celui-là que Google va ajouter au Reader, même s’il y est déjà dans mes fils et même quand on indique une autre page à suivre.

    Existe-t-il une solution ? J’étais prête à créer les RSS avec d’autres services puis à les intégrer dans Google reader, quand j’ai lu ici que Google reader pouvait le faire.

    Mais ça ne marche pas du tout.

    S’il n’existe aucun fil sur le site, là, Google Reader me propose bien de le créer (pas de recul encore pour vérifier si ça fait le job, mais j’ai bien le popup où on me le propose). Mais pas quand il existe déjà un rss sur une autre page.

    Une solution ?

    Merci d’avance.

  12. TOMHTML a dit :

    Utilise plutôt Page2RSS, c’est beaucoup plus efficace. L’outil de Google pour les flux à la volée est long et pénible.

  13. Marie-Micheline a dit :

    Je n’ai pas encore de flux RSS sur mon site, mais je vais essayer avec Google Reader. Merci pour info.

  14. […] Les nouvelles notes dans ce « journal » ne seront annoncées ni par Twitter ni autrement. Vous pouvez les suivre avec l’extension « Update scanner » de Firefox ou avec les solutions RSS proposées par ce site. […]

    Backlink