Google a récemment apporté des clarifications sur le fonctionnement de ses systèmes de classement.

Dans un post publié sur son blog « Google Search Central » en novembre 2022, le géant américain donne ainsi les clés pour comprendre comment il organise les informations à l’échelle mondiale, dans le but de les rendre accessibles et utiles à tous.

Zoom sur les principaux systèmes utilisés par Google pour le classement de ses résultats.

Les systèmes basés sur des IA

Google s’appuie sur plusieurs systèmes d’IA :

  • BERT : cette IA permet à Google de comprendre de quelle manière des combinaisons de mots peuvent exprimer des intentions ou des sens variés.
  • RankBrain : il aide Google à faire le lien entre les mots et les concepts que les internautes peuvent mettre derrière.
  • MUM : celle-ci est capable de comprendre et de générer un langage.

Bon à savoir : on peut aussi noter la mise en correspondance neuronale que Google utilise pour comprendre et mettre en correspondance des représentation de concepts dans les pages, et dans les requêtes cherchées par les internautes. Enfin, Google utilise aussi une IA de classement des passages pour analyser la pertinence d’une page par rapport à une recherche.

Le mot d’ordre pour le contenu : la qualité

Google confirme sa volonté de récompenser les contenus de qualité, en dévoilant :

  • Son système de contenu utile : sa conception même pousse les contenus originaux, pertinents et accessibles dans les résultats de recherche.
  • Ses systèmes garantissant la fiabilité des informations : les pages faisant autorité sont mises en avant, et les contenus de basse qualité sont rétrogradés.
  • Son système d’expérience sur la page : ce système analyse plusieurs critères (par exemple la vitesse de chargement des pages, la sécurisation de l’accès aux pages ou encore l’ergonomie mobile).  A niveau de pertinence égale, le système favorisera le contenu qui propose la meilleure expérience aux internautes sur la page.
  • Son système d’avis sur les produits : l’idée est de récompenser les contenus reconnus de qualité, reposant sur un travail de recherche réel réalisé par des experts sur le sujet.
  • Ses systèmes d’analyse des liens et PageRank : ces systèmes permettent d’identifier les liens entre les pages, pour comprendre de quoi elles parlent et pouvoir proposer aux internautes les pages les plus utiles en regard de leur recherche.

L’intention des internautes, au cœur du mécanisme de recherche de Google

Plusieurs systèmes de classement montrent l’importance accordée par Google aux intentions de recherche des internautes :

  • Les systèmes garantissant la fraîcheur des résultats de recherche : en fonction des intentions de recherche, Google proposera les contenus les plus récents, si cela est pertinent pour l’internaute.
  • Les systèmes d’actualités locales : selon la recherche, présenter plutôt des résultats liés à l’actualité locale de l’internaute peut avoir tout son sens.
  • Le système assurant la diversité des sites : afin de proposer les résultats les plus riches possibles aux internautes, Google s’appuie sur un système empêchant d’avoir plus de deux résultats provenant d’un même site dans les premiers résultats (sauf si jugé particulièrement pertinent pour une recherche en particulier).

Google a également développé des systèmes pensés spécialement pour fournir des informations utiles en période d’urgence ou de crise :

  • Personnelle : l’objectif ? Proposer des contenus d’organismes de confiance et des lignes directes pour des situations d’urgence personnelle (requêtes liées à une ingestion de poison, à la dépendance aux drogues, au vécu d’une agression, etc.).
  • A grande échelle : en cas de catastrophe naturelle par exemple, Google peut déployer un système d’alertes SOS, pour présenter en priorité aux internautes les contenus fournis par les autorités (locales, nationales…).

La traque à la faible qualité et à l’opportunisme SEO

Enfin, le détail des systèmes de classement présentés par Google souligne sa chasse aux contenus peu qualitatifs, avec :

  • Ses systèmes de contenu d’origine : c’est le contenu d’origine qui est privilégié, plutôt que les contenus  qui répètent des informations qui sont déjà sorties avant.
  • Ses systèmes de déduplication : pour une même recherche, des milliers, voire millions de pages peuvent correspondre, dont le contenu peut parfois être assez proche. Pour être sûr de proposer aux internautes les résultats qui les intéresseront, Google ne montre que les contenus les plus pertinents.
  • Ses systèmes de rétrogradation avec suppression : Google a mis en place des règles pour autoriser la suppression d’office de certains contenus (par exemple pour atteinte aux droits d’auteur, pour cause de présence d’informations personnelles, etc.).
  • Son système de domaine pour les mots clés exacts : Google prend en compte le nom de domaine pour juger de la pertinence d’un site face à une requête. Méfiance tout de même, car il est capable de se rendre compte d’une sur-optimisation sans contenu de réelle qualité derrière.
  • Ses systèmes de détection de spam : ils permettent d’épurer les contenus indésirables.

Envie d’approfondir le sujet ? Zoom sur les exigences de Google pour les contenus en 2023.