Adapter son site à l'IA et l'IA agentique
- Intro : que se passe-t-il ?
- Comment fonctionnent ChatGPT, Gemini, et les autres
- Données structurées : organiser la page correctement
- SEO : les points essentiels dans votre site
- Le fichier llms.txt : éditer le fichier destiné spécifiquement aux IA
- Oui je peux le faire moi-même sans passer un professionnel
Intro : que se passe-t-il ?
La semaine dernière, 3 agences en 6 jours m’ont écrit, et avec insistance, pour référencer leurs clients sur gwadaplans.com. J’ai consulté leurs sites, des agences de référencement et de marketing en ligne sérieuses. C’était annoncé : les IA prennent les contenus et les résument pour leurs utilisateurs, même si les sources sont maintenant affichées partout, les utilisateurs s’en contentent (statistiques ici) et la perte d’audience des sites Web se fait fortement sentir…
Je regarde de mon coté pourquoi Gwadaplans, le site est spécifique sur le tourisme en Guadeloupe et ce n’est pas leur clientèle. En comparant les statistiques des observateurs et les miennes, il est apparu que Gwadaplans perdait peu d’audience, 17,4% en un an, pour des statistiques euro-américaines allant d’une perte de 30% du trafic à 75% (source)!
Ajoutons la spécificité de Gwadaplans : les liens externes sont en dofollow, ce qui permet de booster le référencement des sites de mes partenaires. A peu près similaire avec Destination Bouillante, 25% de perte seulement.
Donc panique à bord dans les agences et services marketing ! Ils cherchent des moyens de redresser l’audience de leurs clients.
Mais ce qui se met en place c’est aussi la réservation directe par les agents IA : prise en charge des réservations par l’agent.
Aussi, il m’est apparu important d’informer à propos du dialogue avec l’IA pour s’adapter à ces changements et aux changements futurs.
Voici donc, a minima, des vérifications et des réglages à faire pour adapter son site à l’IA et les agents IA.
Comment fonctionnent ChatGPT, Gemini, et les autres
Gemini Google Search
Le moteur de recherche favori des Européens et Américains vient de lancer aux USA sa recherche uniquement basée sur l’IA, Gemini. C’est la fin de la liste des liens bleus. En Europe, le déploiement arrivera plus tard.
Aussi prévu pour septembre aux USA, bien plus tard en Europe, la nouvelle version d’Android où l’IA est intégrée dans tout le système, accède à vos applications et propose de gérer directement vos email, vos comptes bancaires, l’agent prend le relais de nos manipulations. Avec la RGPD européenne, le déploiement ne pourra pas être aussi catégorique, il est donc aussi prévu bien après.
Gemini c’est aussi la base de la nouvelle IA d’Apple IOS. Gemini ce sont tous les outils Google : recherche, Maps, Reviews,… Gemini est donc un incontournable.
ChatGPT
ChatGPT possède un grand nombre d’utilisateurs car il a été le premier a lancé son IA. Il est surtout fréquent sur les smartphone Iphone d’Apple en attendant qu’Apple lance son IA basée sur Gemini.
ChatGPT ne repose sur aucun moteur de recherche ou application lui permettant d’avoir une base de contenue fiable et dans la durée. Il se repose donc sur des partenariats. J’ai donc fait des recherches et titillé ChatGPT pour comprendre comment il fonctionne et voici le résumé :
J’ai donc fait une recherche d’activités et d’hébergement en Guadeloupe. Le résultat est en résumé, en images et en cartographie avec les notes des utilisateurs. On croirait du Google Maps sauf que… Il manque beaucoup de monde !
Comment fait-il sa sélection ?
Cas d’une activité, en particulier en Guadeloupe.
Au niveau mondial, ChatGPT a passé des partenariats avec TripAdvisor et Booking. Au niveau Français avec le Petit Futé, au niveau Guadeloupe, il utilise les sites officiels d’office du tourisme. Mais l’édition de la liste et de la cartographie, c’est TripAdvisor et Booking. A partir de là il croise les données avec le Petit Futé, puis prend les informations sur les sites locaux officiels et les sites des activités elle-mêmes. Ses sources ne sont pas du tout exhaustives ! Il manque beaucoup de monde et parmi les plus anciens et réputés.
Et les autres
Dans le cas des moteurs de recherches à IA comme Bing de Microsoft, Qwant, ou DuckDuckGo, la question des sources est celle de leur base d’information liée à l’indexation des sites par SEO ou référencement naturel.
Dans le cas d’IA chinoise comme DeepSeek ou encore Qwen, les IA utilisent les informations de moteur de recherche puis croisent les données. Pour LeChat de Mistral on retrouve à nouveau le Petit Futé comme source principale puis des croisements de données pour l’édition d’une liste non exhaustive mais exclusivement liée à TripAdvisor.
Conclusion
Avoir un site Web et une bonne indexation dans les moteurs de recherche reste le point principal. Certaines IA exclue les activités de leurs résultats si elle n’ont pas de site Web.
Le référencement sur le Petit Futé et TripAdvisor ressort souvent.
Langue : à part les IA et moteurs de recherche européens qui sont adaptés au multilinguisme, les IA prennent leur sources sur des références en langue anglaise. Le Français ou les autres langues ne sont que des traductions en direct.
Données structurées : organiser la page correctement
Un moteur de recherche comme une IA ne consulte pas un site Web tel que nous le voyons mais son code HTML. Or, depuis la floraison des CMS comme WordPress ou des outils permettant de créer son site sans coder ont permis à tous, professionnel et particulier, de créer son site sans connaissance du Web, les sites ont perdu de leurs structures HTML allant de la surcharge de code à la destructuration complète des données.
Mais les moteurs de recherche comme les IA lisent le code pas l’apparence sur écran. Voici les erreurs fondamentales qui sont faites sur les sites à corriger pour une bonne lisibilité :
Organisation des titres et paragraphes
Le code HTML est un langage composés de balises qui permettent d’identifier le contenu. Comme toute mise en page, il y a des titres, des sous-titres et des paragraphes.
Toutes les pages doivent comporter un titre principale balisé <H1>, les textes sont balisés par <p>, un sous-titre, H2; H3, etc. doit apparaître sous un titre de niveau supérieur.
Les erreurs fréquentes :
- pas de H1 dans chacune des pages.
- des pages qui débutent avec des H5, puis un H2 et ouf enfin le H1, puis un H3… parce que ça fait joli. Utiliser plutôt du paragraphe <p> en modifiant l’apparence, taille, graisse, police, plutôt qu’un H mal placé.
- des <p> placés comme des titres : graphiquement on met un texte, on l’agrandi, on le met en gras et visuellement ça donne un beau titre : pour un moteur de recherche, c’est un paragraphe.
Pour savoir si votre site est bien structuré, allez sur vos pages et cliquez droit pour accéder au code source, faites crtl F ou pomme F pour recherche les H1, Hx et P et voir comment ils s’imbriquent.
Les images
Les images doivent impérativement avoir leur « alt », le texte alternatif qui décrit l’image. La balise image est noté <img>, là aussi vérifier dans votre code source si les alt sont bien présents.
Autre conseil : inutile de bourrer de mots-clés les « alt », vous perdrez des points de référencement.
Le bruit
Les éditeurs de site Web comme WordPress ou Wix sont agrémentés de nombreuses extensions. Certaines sont indispensables d’autres en surcharge. Nettoyer le site des éléments inutiles.
Ces erreurs proviennent souvent l’implication de plusieurs Webmasters qui, trop souvent, ne connaissent que leurs propres extensions et les ajoutent à des extensions déjà présentes qui font le même travail. Aussi, l’excès de gadgets pour créer une apparence . Vous-même, veillez à ce que votre site soit d’abord fonctionnel et clair, prenez en compte que vos visiteurs intéressés n’y passe que 3 minutes en moyenne ! Dernier point : un site peut être graphiquement très moderne sans pour autant ajouter des effets de partout.
Exemples de site avec bruits ou sans
Cliquez ci-dessous sur les exemples de site pour arriver au code source. Sans besoin de le comprendre, rien qu’en défilant la page, vous verrez la différence.
SEO : les points essentiels dans votre site
Comme vu ci-dessus, le code HTML n’est pas forcément bien lisible pour les moteurs de recherche et les IA. Je vais pas faire un cours de SEO maintenant juste rappeler les bonnes pratiques et vous dire comment on réalise un fichier site map pour les aider à circuler sur le site.
Bonnes pratiques
Le SEO ou référencement naturel, il s’agit d’une série de bonnes pratiques pour son site.
- Un site lisible avec des données structurées
- Des images optimisés
- Allègement du code pour aller à l’essentiel
- Remplir les « alt » des images
- Mettre titre, mots-clés et description pour chaque page dans l’entête invisible du site
- Ne pas surcharger les descriptions, les mots-clés inutilement, c’est tentant mais en réalité nuit au bon référencement
IMPORTANT
Si vous avez des partenaires gratuits ou payants qui font un lien vers votre site, assurez-vous que le lien est en dofollow. Lorsque l’on fait un lien vers un site Web, par défaut il est en dofollow, les moteurs de recherche prennent donc en compte le lien et ceci augmente votre référencement. Mais certains partenaires privatisent vos annonces en le rendant nofollow.
Pour vous assurez que votre lien est bien en dofollow, allez sur le site en question, cliquez droit sur le lien vers votre site et choisissez « Inspecter ».
Une fenêtre affichera le code source au niveau du lien. Voici les trois lien avec balise « rel » que vous ne devriez pas voir :
- rel= »nofollow »
- rel= »sponsored »
- rel= »ugc »
Assurez vous que vos partenaires pratiquent bien le dofollow.
Le fichier sitemap.xml
Pour aider les moteurs de recherche, nous éditons un fichier qui lui présente toutes les pages du site, leur date de dernière modification, leur priorité de contenu,… Si vous utilisez un CMS, les extensions de SEO sérieuses le font automatiquement.
Pour vérifier que vous avez bien le fichier sur votre site, c’est tout simple. Allez sur votre page d’accueil et ajouter sitemap.xml après le nom de domaine comme suit :
mondomain.com/sitemap.xml
S’il apparait, ou plusieurs, vous pouvez les lire et vérifier mais à priori, tout va bien.
Si rien n’apparaît, soit installez l’extension qui le fait, soit faites-le vous-même avec cette syntaxe dans un bloc-note :

Ou bien ouvrez cet exemple, copiez-le et adaptez-le.
Pour le mettre en ligne, connectez-vous au tableau de bord de votre hébergement, allez sur la gestion de l’hébergement et trouvez le module FTP. Sur le module FTP, vous accéderez directement aux fichiers de votre site et pourrez placer votre fichier à la racine du site, là où se situe la page index.html ou index.php.
Le fichier llms.txt
Dialoguez directement avec l’IA et ses agents pour présenter son site et lui dire ce qu’elle peut ou pas en faire avec le fichier llms.txt. Déjà adopté par des millions de site, mais pas encore les centaines de millions, il se positionne comme un impératif. Le gros avantage est qu’il est moins technique car les IA LLM sont entraînées à comprendre notre langage. Mais il y a déjà des instructions techniques à prendre en compte.
Français, anglais ou les deux. J’ai opté pour les deux car les IA travaillent en anglais et traduisent ensuite. En leur fournissant les deux langues, c’est plus adapté à sa compréhension et sa traduction.
Voici celui de Gwadpalans, pas besoin de tout mettre, restons simple.
Toutes les options que j’ai prises, notamment sur les autorisations d’entraînement d’IA et pas d’autres sont des choix facultatifs et personnels. Vous pouvez faire les vôtres ou supprimer les éléments.
Toute ligne commençant par # est commentaire pour soi-même, pas pour l’IA.
Evitez les accents, cédilles et apostrophes.
Ouvrez cet exemple, copiez-le et adaptez-le.
Pour le mettre en ligne, connectez-vous au tableau de bord de votre hébergement, allez sur la gestion de l’hébergement et trouvez le module FTP. Sur le module FTP, vous accéderez directement aux fichiers de votre site et pourrez placer votre fichier à la racine du site, là où se situe la page index.html ou index.php.
Oui je peux le faire moi-même
Si vous avez lu tout cela ! Bravo vous êtes courageux mais peut-être découragé ?!
Avec les exemples à copier coller vous devriez vous en sortir pleinement. Mais surtout, faites-vous aider précisément par les IA. Je conseille LeChat de Mistral et Copilot de Microsoft pour tout ce qui est relatif à vos CGV, Politiques de confidentialité, Mentions légales et même le codage.
Pour audit rapide de votre site et son positionnement, contactez-moi, c’est gratuit! Si vous avez des questions aussi.