• Open Garden
  • Posts
  • Sous le capot #4 : Comment mesurer (gratuitement) le trafic que vous apportent les LLM

Sous le capot #4 : Comment mesurer (gratuitement) le trafic que vous apportent les LLM

Quatrième épisode de notre rubrique “Sous le capot”, une rubrique qui a vocation à vous éclairer sur quelques-unes des pratiques structurantes du marché de la publicité digitale.

Cette semaine, François de Broissia, senior director, data et analytics de Jellyfish, nous explique comment l’éditeur d’un site peut isoler gratuitement et facilement, au sein de Google Analytics, le trafic que lui apporte ChatGPT, Le Chat et cie.

Dans cette démo, François de Broissia passe par la version server-side de Google Tag Manager pour s’assurer de n’agir que sur les hits visés, sans impacter le reste de la configuration. “La librairie GA4 est très sensible client-side, plus on la laisse tranquille, mieux elle se porte”, assure l’expert. 

Autre précision, non, François de Broissia n’est pas devenu du jour au lendemain, un champion de l’e-commerce. Pour les besoins de l’exercice, il a juste “biaisé” ChatGPT en le prévenant, avant la démo, qu’il allait lui poser la question et en lui demandant de répondre avec un lien vers son site prototype. 

Enfin, il convient de préciser qu’on ne peut malheureusement pas avoir l’information “referrer” quand le trafic vient de l’application ChatGPT. D’ailleurs, les LLM qui ont des applications dédiées (par exemple chatGPT) ont tendance à générer un lien en webview, comme le font certaines applications sociales, type Facebook ou Instagram, plutôt que de vous envoyer sur une URL Web. “Il est, à date, impossible d'identifier la webview chatGPT mais c'est possible que ça évolue comme ça a été le cas avec Facebook ou Instagram, qui ont des user-agents dédiés”, estime François de Broissia. 

Les étapes de mise en place dans Google Tag Manager (GTM) server-side

1. Comprendre comment Google Analytics identifie les sources de trafic

Google Analytics classe le trafic en fonction de plusieurs critères, dans cet ordre :

  1. GCLID / DCLID (pour les campagnes Google Ads / DV360)

  2. UTM (si des paramètres de tracking sont présents)

  3. Referrer (référent) (si aucun des deux précédents n'est disponible)

Pour les LLM, il n’y a généralement pas d’UTM, donc seul le referrer est disponible.

2. Créer une variable pour récupérer le referrer dans GTM server-side

  • Aller dans Google Tag Manager, dans votre container server-side

  • Créer une nouvelle variable de type event data appelée page_referrer

  • Cette variable va récupérer la valeur du referrer que Google Analytics détecte automatiquement

3. Créer une table regex pour identifier les LLM

  • Créer une RegEx Table (table d'expressions régulières)

  • En entrée (input) : la variable page_referrer

  • Ajouter des règles pour reconnaître les domaines des LLM, par exemple :

  • Si aucun match, renvoyer une valeur par défaut (not set)

4. Appliquer une transformation dans GTM server-side

  • Aller dans Transformations (fonctionnalité propre à GTM server-side)

  • Créer une règle pour modifier les données avant qu'elles ne soient envoyées à Google Analytics

  • Condition : si la variable regex_table n'est pas "not set"

  • Ajouter deux nouveaux paramètres :

    • campaign-medium → llm

    • campaign-source → valeur de la variable regex_table (ex : chatgpt)

5. Vérification et validation

  • Passer GTM server-side en mode Preview

  • Cliquer sur un lien généré par un LLM (on peut lui demander de nous renvoyer le lien) et observer les données envoyées

  • Vérifier dans Google Analytics que :

    • Le medium apparaît bien comme llm

    • La source est bien le LLM concerné (ChatGPT, Gemini, etc.)

Conclusion

  • Cette configuration permet de suivre le trafic des LLM de manière propre et différenciée

  • Elle est gratuite et simple à implémenter (pas besoin de GA 360)

  • Elle ouvre la porte à des analyses et optimisations plus fines, par exemple en regroupant ce trafic dans un channel spécifique dans Google Analytics