Google reader propose désormais de suivre les mises à jour de sites n’ayant pas de flux RSS.
Pas forcément révolutionnaire car de tels services existent déjà, avoir cette fonctionnalité directement dans le reader en quelques clics de moins peut faire la différence pour l’utilisateur toujours pressé.
Flux RSS?
Si vous ne connaissez déja pas les flux rss vous l’expliquer ne sera pas forcément facile. Il s’agit d’un système qui permet de notifier a des abonnés que le site est mis à jour… Seulement cette fonctionnalité doit être proposée par le créateur du site/blog.
RSS sans RSS
Que faire des sites qui ne proposent pas de flux? Google va en créer un lui meme a partir des sources du site. Il va essayer car extraire les nouvelles informations d’un site n’est pas évident pour tout type de structure.
Google va tirer avantage de son robot “GoogleBot”, qui aspire le web entier le plus fréquemment possible. C’est un énorme travail déja fait donc autant en profiter.
Maintenant cela sera d’autant plus productif que les sources du sites seront correctement structurés. Un code source respectant les sémantiques des balises aide a deviner le sens de son contenu. Demain le web sémantique et peut être des micro formats finiront le travail de suppression des flux rss, peut être.
Cela ne résout pas le problème du real time ou temps réel… Le google bot ne passe pas toutes les cinq secondes, donc comment savoir que le site est mis a jour dés que cela arrive?
Demain, le système idéal?
Je n’ai pas la prétention de connaitre le meilleur système, mais essayons d’imaginer ce qui serait le plus intéressant pour les éditeurs, les lecteurs et les infrastructures techniques.
Doit ont vraiment maintenir un flux au format xml qui reprends le contenu? Le contenu avec des balises appropriées, standardisées ne serait t’il pas plus simple? Ici google crée le flux a partir du site,on est donc bien dans cette tendance? D’un autre coté un controle exacte du flux permet de le découpler du contenu si besoin…
Un chose est sure, le temps réel est incontournable: il faut être au courant a la seconde prêt qu’une mise a jour est faite. Pour ca le polling n’est pas adapté. Je ne peut pas consulter toutes les secondes le contenu d’un blog pour voir si il a bougé: trop de ressources machines seraient en jeu a l’échelle du web. Les systèmes de ping constituent un première approche mais posent des problèmes comme le spam. La ou google a raison c’est que l’on ne peut tricher sur le contenu, et les backlinks et plus largement la réputation d’un site se fondent sur le contenu visible, effectivement lu par le visiteur…
L’idéal du point de vue utilisateur est plus simple:
- Le bloggueur poste un nouveau billet a l’instant T
- A l’instant T mon reader affiche le titre du billet et un lien
Maintenant aux experts de proposer le système qui répond a ce besoin. Je pense qu’avec les nouveaux protocoles de communication temps réel on n’est plus trés loin d’y arriver. La nouvelle version de netvibes par exemple prétends etre complétement temps réel…mais c’est seulement possible avec les sites qui supportent les protocoles associés….
N’oublions pas que le “real time” nécessite des infrastructures adaptées: si vous avez beaucoup d’abonnés a votre site, vous avez forcément beaucoup de monde a prévenir (push). Cela peut être un sacré job (réseaux + protocoles + erreurs) il vous faudra un bon système de hub pour notifier tout le monde… le plus vite possible!
Ressources
Google Reader Can Now Track Changes to Any Website – Even if it Can’t Find a Feed
Google Reader Lets You Subscribe to Any Page on the Web
Subscribe to any page with Google Reader. No feed? No problem.
Google Reader Notifies Changes in Sites Without Feeds – PCWorld
