Extraits enrichis, données structurées : de quoi s’agit-il ?

Pour ceux qui ne connaissent pas et qui s’interrogeraient sur ce nom peu évocateur, voici quelques explications sur ce que sont les extraits enrichis.

Qu’est-ce qu’un extrait enrichi ?

Les extraits enrichis sont présents dans les résultats des moteurs de recherche. Ils apparaissent au même titre que les résultats classiques, mais ils ont un petit plus : une photo concernant une recette, des étoiles de notation concernant un produit (ou une recette, ou d’autres « entités »), une courte liste d’événements (concerts, …), une date discrètement affichée, un fil d’Ariane à la place de l’adresse du résultat, etc.

Comment un extrait de résultat de recherche peut-il être enrichi ?

Ces résultats améliorés sont produits par les moteurs, grâce à des informations récupérées lorsque leurs robots explorent et enregistrent les pages web.

  • Dans le cas d’un résultat classique, le robot (logiciel) du moteur évalue différents éléments sur la page. Pour comprendre les sujets traités par cette page, il analyse le contenu de celle-ci. Pour établir sa popularité, il comptabilise le nombre de liens web pointant vers elle. Dans le détail, c’est plus complexe mais c’est en tout cas la base du référencement naturel. Pour construire l’extrait de recherche affiché dans les pages de résultats, il récupère des contenus de balises spécifiques et dédiées : le titre et la description.
  • Pour les extraits enrichis, qui sont donc des résultats classiques améliorés, des éléments supplémentaires sont récupérés et traités. Il s’agit de données transmises aux moteurs en complément des contenus affichés par une page. Ces données sont formatées pour faire connaître la nature précise des informations partagées avec les robots.

Les données structurées, c’est quoi ?

Les pages web sont destinées aux navigateurs, qui les interprètent et affichent le contenu mis en forme. Les données transmises pour les extraits enrichis sont destinées directement aux robots des moteurs de recherche.

  • Là où il y a écrit « j’adore la soupe aux choux », un moteur devinera éventuellement s’il s’agit du film ou du plat culinaire en s’aidant du contexte de la phrase, de la page, du site.
  • En revanche, avec les données structurées, une suite de chiffres est spécifiquement définie en tant que numéro de téléphone, code postal ou référence ISBN. Il n’y a plus de doute au sujet du plat ou du film, selon le goût de chacun.

Ces définitions sont présentes sur de nombreux supports : pages web, Wikipedia, mais aussi de nombreuses bases documentaires inconnues du commun des mortels. Elles peuvent être mises en relation, et forment des schémas ou graphes. Les grands réseaux sociaux utilisent leurs propres variantes (avec des syntaxes et des objectifs différents).

Qu’est-ce que ça change ?

Pour les moteurs de recherche, Google en tête, l’intention affichée depuis déjà plusieurs années est de devenir un moteur de réponses. Quand nous faisons une recherche, nous préférons plutôt obtenir une réponse qu’une sélection de résultats (au moins dans la majorité des cas). De nombreuses pages de résultats présentent déjà des réponses sur des sujets encyclopédiques (histoire, données économiques et géographiques, etc.) , très demandés (séries, films et artistes, météo, …) ou encore sur des marques connues. Dans de nombreux cas, les réponses apportées correspondent aux attentes. En accumulant des informations précises et structurées sur des sujets de plus en plus variés, Google construit petit à petit une nouvelle référence qui dépasse Wikipedia. Il a décidé d’appeler cet univers parallèle le Knowledge Graph.

Cela pose des questions très sérieuses sur l’information au sens large : le moteur est par exemple utilisé par près de 95% des internautes. Bien entendu, c’est loin d’être le moteur de recherche le plus totalitaire, ce qui fait en partie son succès. La responsabilité du moteur est en tout cas, dans ces réponses du Knowledge Graph, beaucoup plus importante que pour les résultats qui apparaissent dans ses pages. Les implications seront nombreuses, notamment avec le développement de la recherche vocale (qui appelle plus une réponse que des résultats).

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *