Bien que Google SGE ne soit pas encore disponible dans l’Union européenne, chez Human Level, nous avons voulu prendre une longueur d’avance et étudier cette nouvelle évolution autant que possible afin de pouvoir donner à nos clients une réponse sur l’impact qu’elle pourrait avoir sur leurs activités.
Nous avons analysé des centaines de recherches et nous vous livrons ci-dessous nos impressions : qu’est-ce que Google SGE, quel impact il pourrait avoir sur les habitudes de recherche des utilisateurs, sur le rôle de Google en tant que générateur de trafic organique de qualité et sur la façon dont nous faisons du SEO. C’est un peu long, mais nous vous prévenons, ça en vaut la peine.
Voulez-vous vous joindre à moi ?
Qu’est-ce que Google SGE ?
Google SGE (Search Generative Experience) est une nouvelle façon de répondre aux recherches des utilisateurs en combinant la puissance des grands modèles de langage (LLM) tels que ChatGPT avec les capacités de crawling en temps réel d’un moteur de recherche comme Google pour améliorer la fiabilité des réponses et citer des documents à l’appui.
Cathy Edwards était chargée de présenter Google SGE lors de la conférence Google I/O du 10 mai dernier et, jusqu’à récemment, il n’était disponible que sur autorisation d’adhésion au programme Google Search Labs aux États-Unis, en Inde et au Japon. Depuis le 9 novembre dernier, il a été déployé dans 120 pays, mais le Canada et l’Union européenne n’en font pas partie, probablement en raison de leur législation plus restrictive en matière de protection des données et de réglementation des systèmes faisant appel à l’intelligence artificielle (IA).
Pour accéder aux résultats de Google SGE à partir d’un pays non encore inclus dans le programme, il faut disposer d’un profil Google authentifié par un téléphone portable local de l’un de ces pays et naviguer avec une IP de connexion conforme à cette authentification.
Le développement de Google SGE repose sur deux concepts clés :
- Les grands modèles linguistiques (LLM).
- La génération améliorée par récupération (RAG).
Voyons de quoi il s’agit.
Que sont les grands modèles de langage (LLM) comme ChatGPT ?
Un LLM (Large Language Model) est un type de modèle d’intelligence artificielle conçu pour comprendre et générer automatiquement du langage humain. En fait, il fonctionne comme un cerveau artificiel qui traite de grandes quantités de texte pour apprendre des modèles et des structures de langage, et utilise ces connaissances pour prédire et générer de nouveaux textes.
ChatGPT est un type spécifique de LLM appelé GPT (Generative Pre-trained Transformer) qui a été développé par OpenAI. GPT est un modèle de langage basé sur l’architecture Transformer, créée à l’origine par Google, qui utilise des réseaux neuronaux pour traiter de grandes quantités de texte et apprendre à en générer de nouveaux.
Comment les LLM sont formés ?
ChatGPT apprend à partir de l’analyse et de l’identification de modèles dans de grands ensembles de données fournis par des tiers ou accessibles au public en ligne. L’un des articles qui explique le mieux le fonctionnement de l’intelligence artificielle générative est celui du Financial Times.
Les ensembles de données utilisés pour former GPT 3.5 sont les suivants :
Common Crawl
C’est est un ensemble de données créé par une organisation à but non lucratif du même nom. Common Crawl emploie un robot dont l’agent utilisateur est CCbot/2.0 pour crawler du contenu accessible au public en ligne. CCbot respecte les directives énoncées dans le fichier robots.txt ainsi que dans la balise méta CCbot, ce qui permet de bloquer le crawling, l’indexation ou le suivi des liens sur une page. Toutefois, le fait de bloquer CCbot maintenant ne signifie pas que le contenu précédemment exploré qui fait déjà partie de son ensemble de données sera supprimé. Nous ne ferions qu’empêcher le crawling de nouveaux contenus. Il est important de noter que des ensembles de données tels que Common Crawl sont utilisés par les sociétés de publicité pour catégoriser le contenu et segmenter la publicité qui y apparaît. Bloquer l’accès à CCBot pourrait avoir un impact sur certains réseaux publicitaires.
WebText2
C’est un jeu de données propriétaire d’OpenAI obtenu en crawling des sites internet ayant plus de 3 votes sur Reddit, en partant du principe que le contenu de ces sites est fiable et précis. La version originale de WebText contenait environ 15 milliards de tokens (unité minimale d’information), tandis que WebText2 est une version étendue de 19 milliards de tokens. C’est cette version qu’OpenAI a utilisée pour entraîner GPT 3 et GPT 3.5. L’ensemble de données WebText2 est privé et n’est pas accessible au public. Toutefois, il existe une version OpenWebText2 accessible au public, qui permet de vérifier les URL sources des données. On ne sait pas quel agent utilisateur utilise WebText, il n’est donc pas possible d’en bloquer l’accès via robots.txt ou au niveau du serveur.
- Livres1 (Books 1)
- Livres2 (Books 2)
- Wikipédia
Seuls Common Crawl et Wikipédia trouvent leur origine directe dans le crawling de données en ligne.
GPTBot est l’agent utilisateur de ChatGPT. Si nous ne voulons pas qu’il utilise notre contenu comme données d’entraînement, il peut être bloqué via le fichier robots.txt.
Le modèle ChatGPT
Actuellement, ChatGPT ne peut pas crawler du contenu en ligne. Ses réponses sont basées sur l’entraînement à partir d’ensembles de données collectées jusqu’à une date donnée. Cependant, il existe déjà des plug-ins de navigateur qui permettent à ses modèles de lire des informations directement à partir de sites en ligne, ainsi que d’autres applications lancées récemment.
Le modèle ChatGPT mis en œuvre par Bing utilise les informations obtenues lors d’une recherche « traditionnelle » pour résumer, synthétiser et extraire les informations les plus précieuses du contenu trouvé dans ces résultats.
Les LLM fragmentent le contenu crawlé dans ces ensembles de données en unités d’information de base ou tokens qui peuvent être chiffrés. Ils observent ensuite quand ces unités sont plus ou moins proches les unes des autres en analysant de grands volumes de texte. Le processus génère un vecteur qui stocke les probabilités de trouver ce mot plus ou moins proche d’autres mots. Enfin, les transformateurs traitent non pas des mots isolés, mais des phrases, des paragraphes, voire des articles entiers, en analysant les relations entre toutes leurs parties. En tenant compte du contexte, ils peuvent mieux comprendre le sens de chaque mot.
Avant d’aller plus loin, il est utile de comprendre ce qu’est un graphe de connaissances et en quoi il diffère de ces grands modèles de langage (LLM).
Qu’est-ce qu’un graphe de connaissances et en quoi diffère-t-il des LLM ?
Les réseaux de connaissances sont un type de réseau. Les graphes sont des structures simples qui utilisent des nœuds (ou sommets) reliés par des relations (ou arêtes) pour créer des modèles de haute-fidélité d’un domaine.
Google a introduit les résultats formatés par le Knowledge Graph en mai 2012 et a progressivement augmenté le type et le nombre d’entités pour lesquelles il renvoie ce type de résultats.
Si l’on compare en parallèle les résultats obtenus à partir d’un grand modèle de langage tel que ChatGPT avec ceux renvoyés par le Knowledge Graph de Google, on constate les principales différences entre ces deux modes de stockage et de récupération de l’information :
Avantages du graphe de connaissance par rapport à un LLM
- Information générale vs. Information spécifique : D’une part, ChatGPT et les modèles similaires sont supposés, en principe, avoir une connaissance générique et globale, tandis que le graphe de connaissances de Google n’est présenté que pour les recherches d’informations sur des entités que Google a déjà reconnues et dont les relations sont basées sur des données. Nous aurions d’une part une connaissance implicite de la part des LLM alors que les graphes de connaissances présentent une connaissance plus structurée.
- Hallucinations vs. Précision et fiabilité : Les LLM sont des modèles linguistiques prédictifs qui génèrent du contenu à partir d’une instruction (prompt) mais dont les informations peuvent être totalement erronées (dans l’image ci-dessus, la plupart des livres référencés par ChatGPT n’existent pas réellement et pour ceux qui existent, les auteurs ne sont pas les bons). Au contraire, les informations présentées dans le Knowledge Graph de Google sont généralement fiables et cautionnées par les sites internet sources qui y sont liés.
- Boîte noire vs. Modèle interprétable : Les grands modèles de langage utilisent des réseaux neuronaux qui « apprennent » d’une manière difficile à prévoir et à contrôler, fonctionnant comme une « boîte noire », alors que les informations structurées du Knowledge Graph sont faciles à interpréter, à valider et à prévoir.
- Absence de mise à jour vs. Connaissance en progression permanente : Les grands modèles linguistiques sont formés sur des ensembles de données existant à un moment donné, ils n’ont donc pas la possibilité de mettre à jour leur base de connaissances en temps réel, alors que l’information reflétée par le graphe de connaissances peut être mise à jour en permanence.
Avantages du LLM par rapport à un graphe de connaissance
Les LLM sont en avance sur les graphes de connaissances à certains égards :
- Connaissance générale contre données incomplètes : En principe, nous pouvons interroger un LLM sur n’importe quel sujet, alors que Google ne présente le panel de graphes de connaissances que pour un nombre limité d’entités.
- Compréhension du langage naturel : De par leur fonctionnement même, les grands modèles de langage sont capables de répondre à des questions posées en langage naturel, et même d’ajuster leur réponse à la demande de l’utilisateur. En revanche, un réseau de connaissances ne présente que les informations disponibles pour l’entité identifiée, mais ne donne pas à l’utilisateur la possibilité de poser des questions complémentaires.
Après avoir vu les forces et les faiblesses des grands modèles de langage (LLM) par rapport à d’autres formes de stockage et de récupération d’informations telles que les graphes de connaissances, voyons ce qui différencie Google SGE de ChatGPT et pourquoi cette différence est fondamentale :
- Sauvegarder la réputation de Google en tant que source de référence d’informations fiables, en minimisant la possibilité d’hallucinations propres aux LLMs.
- Introduire l’intelligence artificielle générative dans les résultats de recherche tout en respectant les droits de propriété intellectuelle et les revendications des créateurs de contenu.
- Éviter de perdre la prééminence en tant que source de trafic organique de qualité pour les sites internet.
- Garder intact son propre modèle de monétisation (Google Ads).
Tout cela est lié à la génération augmentée de récupération (recovery-augmented generation, ou RAG).
Qu’est-ce que la génération augmentée de récupération (RAG) ?
La génération améliorée de récupération (RAG) est un paradigme dans lequel des documents et/ou des données pertinents sont collectés à partir d’un graphe de connaissances basé sur la requête d’un utilisateur. Ces données sont ajoutées en tant qu’indices ou données fiables pour créer automatiquement une invite plus précise. Cela permet d’améliorer la précision et la fiabilité de la réponse du modèle linguistique (LLM).
Google a appliqué ce paradigme au SGE probablement en combinant différents modèles propriétaires tels que REALM, présenté en février 2020, RETRO, présenté deux ans plus tard, RARR, publié en mai 2023, FreshLLMs, publié dans un article en octobre 2023.
Les principaux avantages de l’application du paradigme RAG sont les suivants :
- Il améliore la précision des réponses et prévient largement les hallucinations.
- Il permet d’attribuer les informations fournies à leurs sources d’origine et de les relier afin de permettre à l’utilisateur d’approfondir plus facilement les aspects souhaités de la recherche.
- Il évite la limitation des LLM à la dernière date de mise à jour des ensembles de données qu’ils utilisent comme données de formation.
Anatomie des résultats dans le tableau de bord de Google SGE
Les résultats renvoyés par Google SGE sont présentés différemment selon l’objet de la recherche.
Nous montrons ci-dessous à quoi ressemble ce résultat pour une recherche d’informations :
Ce dispositif a d’ailleurs évolué depuis son introduction. Au départ, il ne comportait pas de liens vers les sites internet référencés, ce qui a déclenché une vaste levée de boucliers de la part des créateurs de contenu. Il était également clairement ombré pour le différencier des résultats organiques traditionnels et, pour les recherches où il apparaissait, il était entièrement affiché dès le départ, occupant la quasi-totalité de l’espace au-dessus du pli.
Au fil des mois, nous avons vu comment Google a inclus les carrousels secondaires de résultats accessibles par des liens qui les affichent sous chaque paragraphe. Il a également adouci l’ombrage initial jusqu’à le rendre presque imperceptible et, enfin, il ne montre le panneau que partiellement déplié et c’est à l’utilisateur de décider s’il veut finir de l’étendre ou non.
Étant donné qu’il s’agit d’une fonctionnalité encore à l’essai qui peut avoir une incidence profonde sur les habitudes de recherche des utilisateurs, ainsi que sur le rôle de Google en tant que générateur de trafic organique et sur son principal mode de monétisation, Google Ads, il est logique que l’entreprise ait testé de multiples façons et solutions pour intégrer ce nouveau panneau dans les pages de résultats.
Quel est l’impact de Google SGE sur les résultats traditionnels ?
Dans certains cas, l’impact de Google SGE sera proche de zéro, tandis que dans d’autres, on s’attend à ce qu’il ait un impact sur le taux de clics (CTR) de la même manière que les résultats en vedette, en diminuant de manière significative le nombre de clics sur les premières positions.
Les tests effectués ont permis d’identifier différents cas de figure :
- Instantané alimenté par l’IA non disponible : Le SERP est le SERP traditionnel et ne présente pas la possibilité de générer un instantané alimenté par l’IA.
- Le panneau de résultats de Google SGE ne s’affiche pas au démarrage, mais il est disponible via le bouton Générer.
- Panneau de résultats de l’ESG de Google partiellement affiché au démarrage.
Auparavant, nous avons détecté deux autres cas qui sont maintenant indisponibles depuis quelques semaines :
- Panneau de résultats de Google SGE non affiché au démarrage, mais disponible via le bouton Converse : Ce bouton n’est plus affiché.
- Panneau de résultats Google SGE entièrement affiché au démarrage : Nous n’avons trouvé aucun cas où le panneau de résultats SGE est entièrement affiché dès le démarrage.
Dans un échantillon beaucoup plus large de recherches comportant un mélange de mots-clés informationnels, transactionnels et locaux, Michael King a constaté que Google affichait le panneau de résultats du SGE dans près de 40 % des recherches.
Quel type de requêtes Google SGE ne résout pas ? YMYL
En général, Google SGE n’affiche pas de résultats pour les recherches liées à votre argent, votre vie, car dans ce cas, les résultats pourraient avoir un impact sur la santé physique ou financière des utilisateurs.
Étant donné que le contenu généré par Google SGE n’est pas une copie conforme d’un résultat externe, Google lui-même serait légalement responsable de l’exactitude ou de la fiabilité des informations affichées, ce qui, dans ces cas, implique un grand risque.
Les thèmes directement concernés sont les suivants :
- La santé ou la sécurité physique de l’utilisateur.
- Sécurité financière.
- La société dans son ensemble : C’est-à-dire les questions conflictuelles ou controversées susceptibles d’affecter la stabilité de la société, la confiance dans les institutions publiques, etc.
Par exemple, si nous cherchons « quel type d’hypothèque peut être pris en charge », Google affiche le panneau de résultats SGE mais inclut un message d’avertissement : « Ceci n’est pas un conseil financier professionnel. Il est préférable de consulter un conseiller financier pour obtenir des recommandations spécifiques concernant votre situation particulière ». Si, en outre, nous spécifions la recherche « quel type d’hypothèque est abordable si j’ai 50 ans », Google ne présente même pas le panneau SGE comme une option.
D’autres exemples : « Quel type de compte courant dois-je ouvrir pour économiser de l’argent ? » présente le panel SGE accompagné de la clause de non-responsabilité susmentionnée. Si je spécifie autre chose : « Quelle est la meilleure carte de crédit si j’ai de mauvais antécédents en matière de crédit », cela ne génère plus de résultats SGE.
Pour des recherches plus contradictoires : « Dois-je investir mes économies dans le bitcoin », Google reste évidemment prudent et n’affiche pas le panneau SGE.
Il en va de même pour les recherches de conseils médicaux, par exemple : « comment puis-je perdre trois tailles de pantalon en deux semaines » ou la controverse « pourquoi les États-Unis devraient-ils interdire la vente d’armes d’assaut ». Dans la plupart des cas, Google ne présente pas le panneau de résultats SGE et, lorsqu’il le fait, il l’accompagne toujours d’une sorte de message d’avertissement.
Quel pourrait être l’impact de Google SGE sur le SEO ?
Pour évaluer réellement l’impact de Google SGE, il faudra attendre qu’il soit lancé dans un plus grand nombre de pays et qu’il soit accessible au grand public. Pour l’instant, il n’est disponible que dans 120 pays, pas en Europe ni au Canada, et seulement pour un groupe d’utilisateurs qui ont opté pour cette fonctionnalité dans leur profil Google.
Cependant, même si Google affiche ce type de résultats au grand public, l’impact sera plus ou moins important :
Toutes les recherches ne génèrent pas de résultats SGE
Pour les recherches qui ne génèrent pas de résultats SGE ou pour lesquelles l’utilisateur doit « forcer » l’apparition du panneau en cliquant sur le bouton qui les génère, l’impact sur le trafic organique sera très faible. Les utilisateurs cliqueront sur le résultat qui correspond le plus directement à leur intention de recherche, avant de faire un clic supplémentaire et d’attendre quelques secondes que Google complète le panneau SGE (dans les cas où il finit par l’afficher, ce qui n’est pas toujours le cas).
Dans les recherches d’informations en réponse directe
Nous pouvons nous attendre à une baisse du CTR similaire à celle que nous obtenons lorsque Google présente un résultat détaillé (featured snippet). Dans ce cas, tout dépend si l’extrait présenté par Google dans le panneau SGE est considéré comme suffisant pour satisfaire l’intention de recherche de l’utilisateur ou non.
Pour les recherches transactionnelles
Le parcours du client sera raccourci. On peut s’attendre à moins de clics sur les pages de catégories de produits (cette partie du processus de décision est déplacée vers les pages du moteur de recherche) et à plus de clics sur les pages de détails des produits, mais avec un taux de conversion plus élevé, puisque l’utilisateur aura eu l’occasion de comparer et d’opposer les avantages et les inconvénients dès le panneau de résultats du SGE lui-même.
Dans tous les cas, le CTR (même pour la position 1) diminuera
Pourquoi ? Car les résultats organiques sont « poussés » vers le bas par les annonces et le panneau SGE. Désormais, l’objectif du positionnement est beaucoup plus large et consistera à obtenir une visibilité dans les multiples formats et widgets qui composent les pages de résultats de Google. Gilad David Maayan s’attend à un impact négatif de 30 à 60% de trafic en moins.
La proportion de recherches ciblées augmentera
Les moteurs de recherche nous ont « entraînés » à formuler nos recherches d’une certaine manière afin d’obtenir les résultats souhaités. L’interface beaucoup plus conversationnelle de Google SGE, où nous sommes encouragés à poser nos questions ou à cliquer sur certaines des questions suggérées, et où les résultats sont également présentés dans un langage naturel, encouragera l’adoption de recherches plus ciblées et plus naturelles. Cela signifie que les pages de détail des produits (PDP) ou les pages de contenu spécifique (actualités, par exemple) enregistreront probablement un volume plus important de trafic organique au détriment des pages de familles de produits ou de catégories de contenu (thématiques). Le positionnement de la longue traîne sera beaucoup plus important.
Dans l’étude précitée de Michael King, les sites classés en première, deuxième et neuvième position apparaissent le plus souvent dans les résultats du SGE et, dans la plupart des cas, Google inclut jusqu’à six des dix premiers résultats dans ce panel.
Les outils de SEO devront s’adapter
Se classer dans les dix premières positions organiques devient insignifiant. On ne sait pas encore quel sera l’impact de Google SGE sur le CTR attendu pour chaque position et donc sur les clics estimés pour chaque mot-clé.
Comment se préparer à Google SGE ?
Une nouvelle opportunité de visibilité
Google SGE est à la fois une menace pour le CTR obtenu pour les premiers résultats organiques et une opportunité de gagner en visibilité dans un nouveau format de résultats qui pourrait marquer l’avenir de Google en tant qu’outil de recherche. Tout ce que nous appliquons pour positionner un site internet reste pleinement en vigueur mais, en plus, faire partie des sources de référence de Google pour composer ses résultats pilotés par l’IA devient un objectif clé supplémentaire. Lors de tests réalisés par Human Level et d’autres cabinets de conseil, nous avons déjà constaté que les sites internet les mieux positionnés sont ceux qui deviennent le plus souvent les cartes de référence dans les différents carrousels de Google SGE.
En cliquant sur l’option A propos de ce résultat, Google affiche des informations qui justifient pourquoi ce contenu et ce site internet ont été choisis comme référence et l’on voit bien comment les désormais célèbres E-E-A-T d’expérience, d’expertise, d’autorité et de confiance (Trust) sont les indicateurs qui peuvent faire la différence. Spécifiquement pour les médias, nous avons commencé à nous familiariser avec ces indicateurs à travers le Trust Project.
Et nous voyons comment ces indicateurs de confiance ont été extrapolés et appliqués aux sites d’entreprise, de voyage, de commerce électronique, aux places de marché, etc. Nous devons donc connaître et appliquer autant que possible toutes les recommandations pour améliorer l’EEAT de notre site internet.
Plus qu’un featured snippet
Dans une certaine mesure, le panneau SGE de Google est une évolution du featured result ou featured snippet. Dans le cas du featured result, Google sélectionne ce qu’il considère comme le résultat optimal pour une recherche, en extrayant la réponse de son contenu et en la reproduisant mot pour mot en haut des résultats. Le panel SGE de Google reprend cette position de premier plan mais, dans ce cas, au lieu d’extraire littéralement l’information d’un seul résultat, il identifie le consensus entre plusieurs sites internet qu’il prend comme référence et synthétise l’essence de l’information fournie en appliquant la génération d’un LLM. Dans les deux cas, l’essentiel est de devenir la référence de Google en tant que source de cette information, car c’est le seul moyen de placer notre lien dans cette zone privilégiée de la SERP.
Tirez parti de la longue traîne
Comme nous l’avons dit au début de ce billet, l’interface conversationnelle de Google SGE va progressivement habituer les utilisateurs à poser des requêtes de manière plus naturelle et plus spécifique à leurs besoins. Il y a une grande opportunité de positionner du contenu pour ces recherches spécifiques qui, bien qu’ayant un potentiel de recherche plus faible, attireront des visites de haute qualité. Mais ce n’est pas tout : n’oublions pas les questions de suivi suggérées ou gratuites avec lesquelles Google encourage les utilisateurs à approfondir leurs recherches. Si les questions des blocs PAA (People Also Ask) nous ont inspiré pour développer de nouveaux contenus, les questions de suivi suggérées nous aideront également à développer des contenus spécifiques pour accompagner nos utilisateurs dans leur processus de décision d’achat. Il convient d’analyser attentivement les questions de suivi proposées par Google pour chacune de nos recherches clés pour lesquelles le panneau de résultats SGE apparaît.
Contrôlez le CTR dans vos résultats
Vérifiez les écarts entre la position moyenne et le CTR obtenu dans Google Search Console :
Une bonne position avec un CTR anormalement bas peut indiquer un impact important d’un résultat vedette ou d’un panneau Google SGE.
Analysez pour quelles recherches le SGE apparaît-il et pourquoi ?
Surveillez les pages de résultats pour chacun de vos mots clés et vérifiez quand le panneau Google SGE apparaît et quand il n’apparaît pas. L’impact le plus important proviendra évidemment des recherches pour lesquelles le panneau Google SGE apparaît.
Une fois que vous avez vérifié ces mots-clés, vérifiez quels sont les domaines les plus fréquemment liés en tant que référence dans le carrousel principal du panneau SGE ou dans l’un des carrousels secondaires. Cliquez sur À propos de ce résultat et essayez de découvrir quels indicateurs de confiance et d’autorité thématique amènent Google à prendre ce domaine comme référence :
Faut-il bloquer l’IA ?
Enfin, on pourrait se demander si nous devrions bloquer les MAJ et autres intelligences artificielles pour qu’elles accèdent à notre contenu. Pour l’instant, nous sommes d’avis que non, pour les raisons suivantes :
- Nous n’en sommes qu’aux premières étapes de l’utilisation de ces modèles d’IA et il n’a pas encore été défini (et encore moins réglementé) ce qui devrait être une utilisation appropriée et équitable en ce qui concerne la propriété intellectuelle des données d’entraînement.
- Selon la manière dont cela est réglementé, les ChatGPT et autres pourraient inclure des mécanismes d’attribution et fournir des liens vers la source originale du contenu, agissant comme une source supplémentaire de trafic web.
- Il est encore trop tôt pour prédire pour quelles catégories de recherche les MLD pourraient devenir un premier choix pour les utilisateurs. Jusqu’à présent, le manque de mise à jour des ensembles de données et l' »imagination » de nombreuses réponses suscitent le scepticisme et les font apparaître comme une source d’information peu fiable.
- Les problèmes juridiques potentiels liés à l’exactitude et à la fiabilité des informations fournies pourraient faire de l’attribution à des tiers la meilleure option pour éviter d’éventuelles poursuites.
Cependant, selon Originality.ai, 20 % des 1 000 premiers sites internet mondiaux bloquent déjà GPTBot à compter de septembre 2023. Parmi eux, de nombreux sites de médias en ligne et certains des plus importants portails de commerce électronique, tels qu’Amazon ou le New York Times.
En tout état de cause, pour empêcher notre site internet d’apparaître dans le panneau SGE de Google, nous devrions bloquer complètement Googlebot, ce qui nous exclurait également des résultats organiques traditionnels.
Quelques exemples de Google SGE
Le panneau de résultats présenté par Google SGE n’a pas une présentation unique, mais adopte une structure différente en fonction du type de recherche effectué. Les modèles les plus représentatifs sont ceux qui s’affichent pour les recherches informationnelles, transactionnelles, locales ou liées aux voyages.
Recherche d’informations
Recherche transactionnelle
Recherche locale
Recherche dans le secteur des voyages
Glossaire
1ère partie
- Search Generative Experiences (SGE) : Technologie de recherche Google qui utilise des algorithmes avancés et l’intelligence artificielle, notamment le modèle unifié multitâche (MUM), pour générer et présenter dynamiquement des résultats de recherche en fonction des requêtes de l’utilisateur.
- Modèle unifié multitâche (MUM) : Modèle d’IA utilisé par Google, conçu pour interpréter et traiter plus efficacement les requêtes de recherche en comprenant le contexte et les nuances qui les sous-tendent.
- SERP (Search Engine Results Page) : La page affichée par les moteurs de recherche en réponse à la requête d’un utilisateur, présentant une liste de résultats correspondant à la requête.
- YMYL (Your Money or Your Life) : Catégorie de contenu ayant un impact significatif sur la santé, la stabilité financière ou la sécurité d’une personne, exigeant une grande précision et une grande fiabilité.
- États du SGE : Différents états dans lesquels SGE présente ses résultats de recherche, affectant la manière dont les utilisateurs interagissent avec ces résultats et les visualisent. Comprend les états « Collapsed », « Opt-in » et « No SGE ».
- État d’effondrement : Le résultat SGE est tronqué et l’utilisateur doit cliquer sur un bouton « Afficher plus » pour voir l’intégralité du contenu.
- État d’acceptation : L’utilisateur doit demander activement un résultat SGE, qui est alors généré pour lui.
- État « No SGE » (pas de SGE) : Certaines requêtes ne génèrent pas de résultat SGE et sont présentées.
- Modules SGE : Attributs ou formats spécifiques utilisés par le SGE pour afficher les résultats de recherche en fonction de l’intention perçue du mot-clé. Il peut s’agir de listes non ordonnées, de recettes, de packs locaux, de vues de produits et de blocs de code.
- Listes non ordonnées : Listes d’éléments pouvant être affichées avec ou sans description, utilisées dans diverses requêtes d’information.
2ème partie
- Recettes : Cartes spécialisées pour les requêtes relatives à la cuisine ou à l’alimentation, comportant des détails tels que le temps de cuisson et les ingrédients.
- Packs locaux : Résultats de recherche locaux adaptés à l’emplacement de l’utilisateur, comprenant souvent des avis et des cartes.
- Vues de produits : Différents formats de présentation des produits, notamment des listes, des carrousels et des cartes de valeur, particulièrement utilisés dans les requêtes portant sur le commerce électronique.
- Bloc de code : Blocs de code générés pour des requêtes technologiques spécifiques.
- Boîte de réponse (Answer box) : Fonctionnalité située en haut des résultats du SGE, fournissant une réponse concise ou un résumé de la requête, avec des informations sourcées.
- Panneau des sources (Source panel) : Panneau situé à côté de la boîte de réponse, affichant les sources utilisées par SGE pour générer son contenu, souvent avec des URL.
- Questions supplémentaires : Invitations au bas des résultats du SGE, conduisant à d’autres requêtes et prolongeant l’expérience de recherche dans un format conversationnel.
Conclusion
Bien qu’elle ait déjà été lancée dans 120 pays, il n’est pas encore certain que Google déploie la fonctionnalité Google SGE et la rende accessible au grand public et à l’ensemble des recherches. Il est logique que Google ait préféré tester massivement ce nouveau format de résultats pour comprendre son impact sur les propres habitudes d’utilisation du moteur de recherche, son modèle publicitaire, le difficile équilibre des relations avec les créateurs et diffuseurs de contenus, etc.
Il est possible que le panel Google SGE qui sera définitivement déployé ressemble à celui que nous pouvons analyser aujourd’hui, mais il est également probable qu’il connaisse de nombreuses évolutions et améliorations, comme nous l’avons vu ces derniers mois. En attendant, il faudra suivre son évolution pour anticiper son impact et se préparer à être compétitif dans ce nouvel espace de visibilité.
FAQ Google SGE
Qu’est-ce que la stratégie SGE ?
Grâce au SGE, les recherches à longue traîne et à faible volume de recherche deviendront beaucoup plus courantes. Côté client, la collaboration entre les partenaires SEO et les équipes internes sera essentielle pour s’assurer que toutes les questions possibles ont trouvé une réponse dans le parcours de l’utilisateur. Si votre stratégie de contenu ressemble déjà à cela, c’est parfait !
Comment optimiser mon site internet pour le SGE ?
Pour classer votre page web dans les résultats SGE, concentrez-vous d’abord sur l’obtention d’une position de première page dans les recherches Google habituelles, ciblez la recherche par mot-clé avec du contenu, et utilisez des phrases brèves et claires pour résumer l’ensemble du sujet de votre page web.
La Google SGE est-elle identique à Google Bard ?
Même si SGE et Bard utilisent tous deux l’intelligence artificielle pour générer du contenu en langage naturel, ils sont fonctionnellement différents. Là où SGE utilise l’IA pour compiler des informations sur le web et les délivrer de manière cohérente, Bard est un chatbot capable de générer du contenu en fonction de vos requêtes.
Quelle est la différence entre SEO et SGE ?
Le référencement (SEO) est l’ensemble des stratégies que les spécialistes du marketing et les professionnels du web utilisent pour améliorer la visibilité de leur site internet ou de leurs produits. Search Generative Experience (SGE), en revanche, est une nouvelle fonctionnalité de recherche de Google qui apporte des capacités d’IA au moteur de recherche afin d’améliorer la manière dont les informations pertinentes sont extraites des meilleurs sites et présentées à l’utilisateur final.
L’expérience de génération de recherche de Google est prête à changer la façon dont nous interagissons avec Google et le web dans son ensemble. Alors que nous passons des modèles de moteurs de recherche traditionnels à ceux alimentés par l’IA, tout le monde, des entreprises aux créateurs de contenu, bénéficiera d’un meilleur échange d’informations sur le web, en donnant la priorité à la fiabilité, à la pertinence et à un contenu axé sur l’utilisateur qui apporte simultanément de la valeur ajoutée et permet de gagner du temps.
Note : Ceci est une traduction libre et enrichie de l’article original écrit par Fernando Maciá de Human Level