Résoudre l'un des plus gros problèmes de Google Analytics 4 : la conservation des données
Publié: 2022-01-20Nous avons récemment publié un article de blog dans lequel nous avons mis en évidence certaines des choses que nous avons apprises au cours de l'année dernière depuis la sortie officielle de Google Analytics 4. GA4 a un certain nombre de très bons arguments de vente. Cependant, il manque encore certaines fonctionnalités ainsi qu'un ou deux problèmes que nous rencontrons avec ses fonctionnalités existantes. Dans notre article, nous nous sommes concentrés sur l'un d'entre eux, à savoir la période de conservation relativement courte de certaines données dans le système.
Période de conservation plus courte dans GA4
Comme mentionné, le problème que nous avons concerne la période de conservation plus courte de données spécifiques dans GA4. Cela n'affecte pas les données agrégées que vous voyez dans les rapports standard. Cependant, cela affecte tous les événements et niveaux d'utilisateurs que vous souhaitez analyser dans la section Explorations de GA4 ou dans une suite de rapports comme Google Data Studio.
Par défaut, la durée de conservation des données est fixée à 2 mois seulement. Pour certaines données démographiques, telles que l'âge, le sexe et les centres d'intérêt, il s'agit de la période de conservation maximale. Pour les événements et autres données utilisateur, vous pouvez choisir entre la valeur par défaut de 2 mois et un maximum de 14 mois.
Cela signifie que si vous souhaitez effectuer une analyse de données datant de plus de 14 mois, vous ne pourrez peut-être pas le faire avec GA4. Un exemple ici pourrait être la préparation de votre vente d'été annuelle. Vous voudrez peut-être revenir en arrière et regarder les performances de votre publicité pour la vente au cours des dernières années. Cela ne serait pas vraiment possible au-delà des rapports de base fournis dans l'interface utilisateur GA4. Ce n'est pas idéal car il peut y avoir des informations vitales à tirer de la comparaison des dernières années de données de campagne.
Un autre exemple ici peut être que vous soupçonnez que différents groupes d'âge sont plus actifs sur votre site à différents moments de l'année. Par exemple, les jeunes au début de la vingtaine visiteront peut-être davantage votre site de voyage à l'approche de la fin de l'année d'études supérieures. Cela peut vous aider à hiérarchiser les forfaits de voyage que vous affichez sur la page d'accueil de votre site. Avec GA4, vous ne pourrez plus effectuer d'analyses sur cette tendance au-delà de ce qui figure dans les rapports standard. Même regarder à la fin du semestre scolaire précédent pour avoir une idée peut ne pas être possible car les données ne seront disponibles que pour les 2 derniers mois.
Bien sûr, il existe de bonnes raisons de supprimer toutes les données dont vous n'avez pas besoin et qui ne servent plus un intérêt commercial légitime, car il s'agit d'une disposition du RGPD et de législations similaires. Cependant, GA4 fait de cette fenêtre de 14 mois le maximum et ce ne sera pas le cas dans de nombreux cas. Dans le cadre de la conformité aux différentes législations et pour protéger la vie privée des utilisateurs, assurez-vous d'avoir l'autorisation de leur part de collecter les données et d'indiquer clairement dans votre politique de confidentialité pourquoi vous collectez leurs données, combien de temps vous les stockez et ce qu'on en fait.
Comment augmenter la durée de conservation ?
Vous pouvez prendre deux mesures d'atténuation pour vous assurer que vous disposez des données GA4 à analyser. La première est une étape assez simple et consiste à modifier votre période de conservation des données dans GA4 de 2 mois à 14 mois.
Vous pouvez le faire en suivant ces étapes :
- Accédez à votre propriété GA4.
- Cliquez sur Admin en bas de la barre de menu de gauche
- Dans la colonne Propriété, cliquez sur Paramètres des données
- Sélectionnez Conservation des données dans le nouveau menu.
- Modifiez le menu déroulant Conservation des données d'événement de 2 mois à 14 mois
- Si la case ci-dessous est cochée, la période de conservation des données utilisateur sera réinitialisée à chaque visite de l'utilisateur. Cela signifie que si un utilisateur visite votre site un mois après sa première visite, ses données spécifiques à l'utilisateur ne seront désormais supprimées que 14 mois après la deuxième visite et non la première.
Connecter Google BigQuery
La deuxième étape est plus compliquée mais elle vous permet de vous assurer que vous êtes en mesure d'avoir toutes vos données d'événement stockées au-delà de leur période d'expiration de 14 mois. Il s'agit de tirer parti d'une fonctionnalité disponible dans GA4 qui n'était auparavant disponible que sur Google Analytics 360, la version d'entreprise premium de Google Analytics. Cette fonctionnalité est un lien automatisé avec Google BigQuery. BigQuery est le système d'entreposage de données basé sur le cloud de Google. Il vous permet de stocker et d'analyser de grandes quantités de données.
La configuration et la gestion de BigQuery et la manière d'analyser et de récupérer des données dépassent le cadre de cet article, mais nous pouvons vous expliquer certains des avantages et à quoi vous attendre.
BigQuery est une offre assez technique et implique de naviguer dans la plate-forme Google Cloud large et parfois déroutante. Par conséquent, une certaine expertise technique est nécessaire pour la configurer et la faire fonctionner. Des connaissances plus spécifiques sont nécessaires pour en extraire des données à l'aide de SQL. Mais si vous avez quelqu'un avec les connaissances requises, c'est un système très robuste et efficace à utiliser.
BigQuery n'est pas une offre gratuite et vous paierez pour mettre des données dans le système, pour la quantité que vous avez stockée et pour extraire des données du système. Chacune de ces trois actions de paiement dépendra d'un certain nombre de facteurs, notamment la façon dont vous insérez les données, comment vous les retirez et sur quels serveurs Google vous les stockez. Le nombre de visiteurs de votre site Web, la part de leur activité que vous suivez, la disponibilité immédiate des données, ainsi que la quantité de données que vous en extrayez et la fréquence à laquelle elles ne feront que figurer dans le coût du système.
En termes d'utilisation des données que vous avez stockées dans BigQuery, elles peuvent être connectées à Google Data Studio. Cela signifie que vous pouvez analyser les données dans un environnement confortable similaire aux autres rapports que vous avez peut-être configurés. Vous pouvez en fait avoir des données BigQuery comme source de données principale que vous utilisez pour analyser les données GA4, car elles contiendront toujours, au pire, des données jusqu'au jour précédent et toutes vos données d'événement sont disponibles. La source de données BigQuery n'est pas identique à celle de GA4 et vous devrez donc adapter tous les rapports que vous avez déjà à la nouvelle source. La connexion directe à BigQuery plutôt qu'à GA4 pour vos données les plus récentes signifie qu'au fil du temps, vous pourrez toujours analyser vos données historiques avec vos nouvelles données, même après l'expiration des données plus anciennes dans GA4 lui-même.
Enfin, BigQuery peut en fait vous aider dans une certaine mesure à vous assurer que vous êtes conforme au RGPD et à d'autres législations en vous permettant de spécifier où vos données sont stockées. Google possède des magasins de données dans le monde entier et vous sélectionnez exactement le magasin de données que vous souhaitez pour votre instance BigQuery. Cela signifie que, compte tenu du RGPD ou du DPA suisse , vous pouvez stocker vos données en Europe et ne pas avoir à vous soucier qu'elles soient stockées dans un pays qui n'a pas les protections de données équivalentes. Plusieurs emplacements à travers l'Europe et la Suisse peuvent être sélectionnés, chacun avec une structure de prix légèrement différente.
Faites-nous savoir si vous avez des questions concernant la configuration de BigQuery de Google, nous sommes heureux de vous aider.