Categories
Web

Extraits enrichis, données structurées : de quoi s’agit-il ?

Un extrait enrichi est un résultat particulier dans les moteurs de recherche : une vignette photo, des étoiles de notation produit, un fil d’Ariane, etc. Petite explication pour les curieux

Dernière mise à jour le 20 October 2020

Les extraits enrichis sont apparaissent dans les résultats des moteurs de recherche au même titre que les résultats classiques, avec un petit plus : une photo de recette, des étoiles de notation de produit, une courte liste d’événements (concerts, …), une date discrète, un fil d’Ariane, etc. Eh oui, c’est tout simplement ça, un extrait enrichi.

Il ne s’agit pas résultats publicitaires ou sponsorisés. Qu’est-ce qui provoque alors ces résultats enrichis ? Comment une page peut-elle en bénéficier ? Que se cache-t-il derrière ?

Comment un extrait de résultat de recherche peut-il être enrichi ?

Ces résultats améliorés sont produits par les moteurs grâce à des informations que leurs robots récupèrent en explorant les pages web.

  • Dans le cas d’un résultat classique, le lien-titre bleu et la description affichés dans les pages de résultats des moteurs sont issus d’éléments spécifiques (balises title et meta description), renseignés dans le code de chaque page, qui ne sont pas affichés directement dans la page pour construire le résultat “classique” affiché dans ses pages.
    [Aparté pour les plus curieux
    Cette règle de base a beaucoup évoluée puisque aujourd’hui, les moteurs réécrivent souvent à la volée le titre bleu et la description pour coller aux demandes de ses utilisateurs (le titre ou sa description ne sont pas idéals par rapport aux termes de la recherche mais le contenu de la page répondra de façon satisfaisante à cette demande).]
  • Dans le cas des extraits enrichis, qui sont des résultats classiques “améliorés”, les moteurs de recherche exploitent des éléments supplémentaires : les données structurées. Il s’agit de données spécifiant la nature précise des informations présentées dans la page : par exemple que si Milou est probablement un fox-terrier à poil dur, c’est surtout un personnage de fiction dans une BD célèbre.

Les données structurées, c’est quoi ?

Les données structurées sont destinées directement aux robots des moteurs de recherche, tout comme certains éléments des pages web tels que les balises title et meta description ou les consignes liées à l’indexation des pages.

  • Là où il y a écrit “j’adore la soupe aux choux”, un moteur peut deviner qu’il s’agit du film ou du plat culinaire en s’aidant du contexte de la phrase, de la page, du site.
  • Avec les données structurées, une suite de chiffres est devient à ses yeux un numéro de téléphone, un code postal ou une référence ISBN.

L’ensemble de ces informations, leurs références et leurs relations issus de nombreuses bases documentaires inconnues du commun des mortels mais aussi de Wikipedia, et sont alimentés par les pages web qui embarquent de plus en plus des données structurées. Ces informations reliées les unes aux autres forment des schémas ou graphes : une sorte d’encyclopédie capable d’associer la soupe aux choux avec shaun of the dead, Mozart et Shakira, ou encore le crapaud commun et son habitat préféré.

Qu’est-ce que ça change dans le monde ?

Les étoiles affichées dans les pages de Google ne changent pas grand chose, en dehors des regards et des clics attirés par la promesse d’une note, d’une évaluation (par une forme d’intervention humaine dans la masse des résultats des moteurs).

Mais pour Google, l’intérêt est supérieur : son intention est de devenir un moteur de réponses, et il le devient de plus en plus. Quand nous faisons une recherche, nous préférons (majoritairement et dans la majorité des cas) obtenir une réponse directe plutôt qu’une sélection de résultats à parcourir. De nombreuses pages de résultats répondent sur des sujets historiques, des données économiques et géographiques, des séries, films et artistes, la météo, … Et les réponses apportées correspondent souvent aux attentes. En accumulant des informations précises, “vérifiées” et reliées entre elles sur des sujets de plus en plus nombreux, Google construit petit à petit une nouvelle référence qui dépasse Wikipedia. Il a décidé d’appeler cet univers parallèle le Knowledge Graph.

Cela pose des questions très sérieuses sur l’information au sens large : le moteur est par exemple utilisé par près de 95% des internautes. La responsabilité du moteur devient de plus en plus importante.

By J-Michotey