Le 2 juin 2011

Schema.org : les moteurs s’unissent autour des microdonnées


Schema.org : les moteurs s’unissent autour des microdonnées

Après robots.txt et sitemap.xml, voici la dernière union sacrée en date des leaders de la recherche en ligne.

Microformats, RDFa, FOAF, GoodRelations, OpenCyc, … Pour communiquer de manière discrète des informations structurées aux moteurs de recherches, les éditeurs de sites web ont à leur disposition une multitude de standards. Les moteurs sont capables d’extraire automatiquement ces données pour une poignée d’entre-eux, c’est ce qui donne les rich snippets dans les pages de résultats.

Le problème est qu’il n’est pas toujours évident de savoir quel standard choisir. Qui plus est quand on sait qu’il peut être compliqué, sinon impossible, d’utiliser plusieurs formats entre eux. Pour palier ces soucis et uniformiser la communication entre moteurs et éditeurs, Bing, Yahoo et Google ont créé schema.org, un nouveau (oui, un de plus…) standard pour les données structurées.

Schema.org est basé sur les microdonnées (microdata en version originale), un concept venu tout droit du HTML5. Cela va alourdir le code HTML par rapport aux Microformats par exemple (simples classes CSS) et le compliquer davantage, mais l’initiative devrait rapidement soutenue par les développeurs et les référenceurs.

Dans la FAQ, le trio des principaux moteurs explique que si vous avez déjà implémenté un autre standard pour les rich snippets vous n’êtes pas obligés de tout changer. Voici un exemple de transformation d’un bout de code HTML

AVANT :
<div>
 <h1>Avatar</h1>
 <span>Réalisateur : James Cameron (né le 16/08/1954)</span>
 <span>Science fiction</span>
 <a href="../movies/avatar-theatrical-trailer.html">Bande annonce</a>
</div>

APRÈS :
<div itemscope itemtype="http://schema.org/Movie">
  <h1 itemprop="name">Avatar</h1>
  <div itemprop="director" itemscope itemtype="http://schema.org/Person">
  Réalisateur : <span itemprop="name">James Cameron</span>
  (né le <time datetime="1954-08-16">16/08/1954</time>)
  </div>
  <span itemprop="genre">Science fiction</span>
  <a href="../movies/avatar-theatrical-trailer.html" itemprop="trailer">Bande annonce</a>
</div>

L’exemple ci-dessous décrit un film (http://schema.org/Movie) mais aussi une personne (http://schema.org/Person). Il existe une kyrielle de types disponibles, et ils peuvent même être étendus si cela ne correspond pas à vos besoins.

Cela risque d’être un peu plus compliqué à faire passer dans les habitudes que le fichier robots.txt ou le sitemap.xml. D’autant plus que ce n’est pas parce que vous implémentez ce schéma que Google et les autres afficheront des descriptions enrichies de vos pages dans les résultats de recherche. Dans tous les cas, c’est un travail qui restera invisible aux yeux des internautes qui visiteront votre site, pas sur que cela devienne du jour au lendemain une priorité les détenteurs de sites web…

Publié le 2 juin 2011 à 20:16 par dans Actualité

Labels : ,

Billet trop ancien. Les commentaires sont maintenant fermés.