Comment optimiser efficacement le transfert de données Google Ads vers BigQuery ?

Le transfert Google Ads vers BigQuery, outil clé pour analyser son marketing, demande maîtrise fine pour exploiter la donnée à fond. Ce guide dévoile comment accélérer les backfills, gérer plusieurs comptes, limiter les tables importées, et automatiser les rafraîchissements, pour un reporting précis et à jour.

3 principaux points à retenir.

Accélérer les backfills en fractionnant les périodes pour contourner les limitations automatisées.
Gérer plusieurs comptes via un MCC unique pour centraliser les données et simplifier la maintenance.
Personnaliser les imports en filtrant les tables nécessaires et automatiser les backfills grâce au Cloud Shell.

Comment réduire le temps de backfill des données Google Ads ?

Pour réduire le temps du backfill dans Google Ads Data Transfer, la clé est de segmenter les périodes longues. Pourquoi ? Parce que Google se limite à programmer les jobs de transfert à un intervalle de 35 minutes. Donc, si vous choisissez une période trop vaste, vous risquez de vous retrouver avec des données récupérées sur plusieurs jours, ce qui n’est pas idéal.

Pour éviter cela, il faut opter pour des segments de 6 à 8 mois maximum. Plus vous scindez en périodes courtes, plus vous optimisez le temps de traitement. Imaginez que vous souhaitez transférer des données sur une période de 24 mois. Si vous envoyez cette demande d’un coup, elle va se retrouver étalée, alors que si vous lisez les données en tranches, disons tous les 3 mois, vous aurez accès à celles-ci beaucoup plus rapidement. C’est un jeu d’enfant finalement.

Maintenant, parlons des pièges à éviter. L’une des erreurs fréquentes dans ce processus est d’entrer un code d’erreur 303 lorsque vous essayez de faire un backfill trop long. Ce code indique que votre job a été rejeté à cause d’une surcharge du système. L’intervalle de 35 minutes devient votre ennemi si vous n’en tenez pas compte. Pensez à établir une cadence bien pensée, avec des plages horaires courtes pour chaque backfill.

Voici un exemple concret pour mieux illustrer :

-- Pour un backfill de données Google Ads de 24 mois
SELECT * 
FROM google_ads_data 
WHERE date BETWEEN '2022-01-01' AND '2023-01-01'; -- Période trop longue

-- Une meilleure approche
SELECT * 
FROM google_ads_data 
WHERE date BETWEEN '2022-01-01' AND '2022-07-01'; -- Segment 1
SELECT * 
FROM google_ads_data 
WHERE date BETWEEN '2022-07-02' AND '2023-01-01'; -- Segment 2

En procédant de cette manière, vous pouvez minimiser le temps d’attente. Et bien sûr, si vous voulez approfondir votre compréhension de la mise en place de ce transfert de données, je vous recommande vivement de lire cet article ici.

Comment gérer plusieurs comptes Google Ads dans BigQuery ?

Gérer plusieurs comptes Google Ads dans BigQuery nécessite une approche stratégique. L’utilisation d’un compte MCC (My Client Center) s’impose comme la meilleure solution. En centralisant le transfert de données à partir d’un MCA, vous évitez la complexité de multiplier les transferts, chaque compte génèrerait trop de datasets et rendrait l’analyse un véritable cauchemar.

Si vous n’avez pas accès à un MCC, il vous faudra procéder à la configuration de plusieurs transferts. Dans ce cas, la rigueur est de mise. Un système de nommage clair et structuré s’avère essentiel pour maintenir l’organisation de vos datasets. Voici une convention de nommage efficace :

plateforme_outil_idClient

Par exemple, pour le compte d’un client fictif dont l’ID est 12345, le nom de dataset pourrait être : googleads_search_12345. En adoptant ce type de nommage, vous pouvez rapidement identifier le type de données et le client concerné, ce qui facilite les opérations de maintenance et rend la lecture des données beaucoup plus intuitive.

Voici quelques exemples concrets :

googleads_display_54321
googleads_video_67890
googleads_shop_98765

Un autre avantage d’une convention de nommage stricte est la simplicité qu’elle apporte lors de la mise à jour ou de l’ajout de nouveaux comptes. En évitant les noms ambiguës ou trop génériques, vous limitez les risques de confusion entre les différents datasets.

Ne sous-estimez pas les impacts sur la maintenance. Des noms de datasets clairs permettent aux analystes de savoir rapidement quel dataset traiter, d’y appliquer des transformations et d’écrire des requêtes SQL ciblées sans passer des heures à se rappeler ce que vous avez nommé quoi. Cela fait économiser temps et ressources, et booste l’efficacité globale de votre gestion de données. Pour une lecture approfondie des processus d’optimisation des données Google, consultez cet article intéressant ici.

Peut-on limiter le nombre de tables issues du transfert Google Ads ?

Il est effectivement possible de restreindre le nombre de tables importées de Google Ads vers BigQuery. Une fonctionnalité qui peut sembler anodine mais qui devient cruciale quand on considère l’ordre et la clarté de vos données. Les 109 tables standard que propose Google Ads, bien que complètes, ne sont pas toujours nécessaires pour chaque analyse. Réduire le flot d’informations peut, à terme, faciliter la gestion des données.

Pour effectuer cette restriction, vous pouvez jouer sur le préfixe et les signes négatifs dans vos configurations d’importation. Par exemple, en excluant des tables comme ClickStats, qui peuvent être particulièrement volumineuses, vous réduisez la surcharge de données et vous rendez vos requêtes BigQuery bien plus agiles. Mais attention, une limitation excessive peut conduire à la perte d’informations potentiellement cruciales. Les données offrent souvent des interconnexions insoupçonnées; ignorer certaines tables peut vous priver d’analyses pertinentes.

Voici la procédure pour affiner votre transfert :

1. Allez dans la section d’importation de Google Ads dans BigQuery.
2. Choisissez l’option de filtrage pour inclure ou exclure certains préfixes de tables.
3. Utilisez le format suivant : `-table_name` pour exclure des tables spécifiques.
4. Confirmez vos sélections et observez le résultat.

Il est préférable de commencer avec une exclusion légère, vous pouvez affiner plus tard si besoin.

Imaginez maintenant une configuration où vous pourriez exclure certaines tables tout en gardant les principales pour le référencement et le suivi des conversions. Cela pourrait ressembler à ceci :


# Exemple de configuration (simulé)
import google.ads.google_ads.client

options = {
    'tables': [
        'Campaigns',
        'AdGroups',
        '-ClickStats',  # Exclusion
        'Keywords',
    ]
}

Pensez à tester régulièrement cette configuration pour vous assurer qu’elle reste pertinente en fonction de vos objectifs d’analyse. Gardez en tête que le but est de maintenir une vue d’ensemble tout en évitant le chaos des données non utilisées. En fin de compte, il s’agit de trouver un équilibre entre la richesse des données et leur gestion efficace, n’hésitez pas à explorer davantage dans les ressources comme celles que vous pouvez trouver sur ce lien.

Comment automatiser les backfills et surveiller les transferts Google Ads ?

Automatiser les backfills via le Cloud Shell n’est pas juste une option, c’est une nécessité pour les entreprises qui jonglent avec des cycles de vente prolongés. Pourquoi ? Parce que les conversions ne se matérialisent pas toujours en un claquement de doigts. Parfois, elles prennent des jours, des semaines, voire des mois. Si vous ne réactualisez pas vos données pour ces périodes plus anciennes, vos rapports perdent de leur fiabilité. Imaginez une conversion qui commence modérément, puis décolle au fil du temps. Si vous oubliez d’intégrer ces informations, vous traitez vos analyses comme un compendium de données incomplètes et biaisées.

Pour minimiser cela et assurer l’intégrité de vos données, vous devez mettre en place une stratégie de backfill efficace. Cela commence par l’extraction de l’identifiant de transfert. Dans le Cloud Shell, vous aurez besoin de vous connecter et d’autoriser l’accès. Voici comment faire :

Ouvrez Google Cloud Shell.
Exécutez la commande suivante pour autoriser l’accès :

gcloud auth login

Une fois connecté, récupérez l’identifiant de transfert à utiliser pour relancer le backfill :

gcloud analytics backfill --transfer-id

Vous pouvez également automatiser cela en utilisant un simple script qui planifie et exécute le backfill régulièrement. Voici un exemple de snippet qui pourrait vous être utile :

#!/bin/bash
# Script pour relancer le backfill
gcloud auth login
gcloud analytics backfill --transfer-id

Ce script simple vous évite d’avoir à retourner dans le Cloud Shell à chaque fois. N’oubliez pas de configurer des notifications par e-mail pour que vous soyez alerté en cas de problèmes durant le processus. Les pertes de données sont inacceptables, alors soyez proactif. Les notifications vous permettent de réagir rapidement en cas d’échec de transfert, garantissant ainsi la continuité et la précision de vos rapports.

Pour approfondir vos connaissances sur la gestion des backfills et la source de trafic dans BigQuery, vous pouvez consulter cet article sur le sujet ici.

Comment exploiter au mieux le transfert Google Ads pour un reporting précis et agile ?

Maîtriser le transfert Google Ads vers BigQuery impose de dépasser le simple paramétrage initial. Fractionner les backfills, utiliser les comptes MCC quand c’est possible, personnaliser les tables importées et automatiser la répétition des backfills via Cloud Shell sont des leviers puissants pour rendre votre pipeline data opérationnel et fiable. Ces méthodes évitent des erreurs classiques, accélèrent les mises à jour et facilitent la gestion multi-comptes. Le résultat ? Un tableau de bord marketing précis, à jour et synthétique, prêt à délivrer la donnée dont les décideurs ont réellement besoin. Prendre le temps d’implémenter ces optimisations se traduit par un avantage décisif en analyse marketing et ROI.

FAQ

Comment éviter les erreurs lors d’un backfill trop long ?

Il faut découper la période de backfill en segments courts (6 à 8 mois max) car Google limite le nombre de jobs en file d’attente. Un backfill trop long génère des erreurs comme le code 303. Le fractionnement permet de contourner cette contrainte et accélère la récupération.

Pourquoi utiliser un compte MCC pour plusieurs Google Ads ?

Le MCC centralise plusieurs comptes Google Ads sous une même entité, évitant la multiplication des transferts et datasets. Cela simplifie la gestion, réduit les risques d’erreurs, et facilite la maintenance des données collectées dans BigQuery.

Peut-on choisir quelles tables importer depuis Google Ads vers BigQuery ?

Oui, il est possible d’exclure certains tableaux en les filtrant à l’import. Cependant, sauf cas très spécifiques, il est recommandé d’importer l’intégralité des tables pour garantir l’exhaustivité des analyses.

Comment automatiser les backfills régulièrement ?

L’automatisation s’effectue via des scripts dans Google Cloud Shell, qui relancent les backfills sans intervention manuelle. Cela est utile pour suivre les conversions évolutives sur des périodes longues dans les business complexes.

Pourquoi activer les notifications email sur les transferts ?

Les emails permettent de détecter rapidement les erreurs ou incidents sur les transferts, pour intervenir le jour même. Cela évite la perte de données et garantit la qualité des reportings marketing en continu.

A propos de l’auteur

Franck Scandolera est consultant expert en Web Analytics et Data Engineering, formateur reconnu et responsable de l’agence webAnalyste et de l’organisme Formations Analytics. Avec plus de dix ans d’expérience, il accompagne agences, e-commerçants et collectivités dans la mise en place d’infrastructures data robustes incluant GA4, BigQuery et automatisations avancées. Son savoir-faire s’étend à la création de pipelines de données, le tracking avancé, et l’automatisation no-code, garantissant des reportings fiables et exploitables au service des business.

Franck Scandolera

⭐ Analytics engineer, Data Analyst et Automatisation IA indépendant ⭐

Ref clients : Logis Hôtel, Yelloh Village, BazarChic, Fédération Football Français, Texdecor…

Mon terrain de jeu :

Data Analyst & Analytics engineering : tracking avancé (GTM server, e-commerce, CAPI, RGPD), entrepôt de données (BigQuery, Snowflake, PostgreSQL, ClickHouse), modèles (Airflow, dbt, Dataform), dashboards décisionnels (Looker, Power BI, Metabase, SQL, Python).
Automatisation IA des taches Data, Marketing, RH, compta etc : conception de workflows intelligents robustes (n8n, App Script, scraping) connectés aux API de vos outils et LLM (OpenAI, Mistral, Claude…).
Engineering IA pour créer des applications et agent IA sur mesure : intégration de LLM (OpenAI, Mistral…), RAG, assistants métier, génération de documents complexes, APIs, backends Node.js/Python.