Resolvendo um dos maiores problemas do Google Analytics 4: retenção de dados

Publicados: 2022-01-20

Recentemente, lançamos uma postagem no blog onde destacamos algumas das coisas que aprendemos no último ano desde que o Google Analytics 4 foi lançado oficialmente. O GA4 tem vários pontos de venda realmente ótimos. No entanto, ainda faltam alguns recursos, bem como um ou dois problemas que temos com a funcionalidade existente. Em nosso post, focamos em um deles, ou seja, o período de retenção relativamente curto para alguns dados dentro do sistema.

Período de retenção mais curto no GA4

Conforme mencionado, o problema que temos gira em torno do menor período de retenção de dados específicos no GA4. Isso não afeta os dados agregados que você vê nos relatórios padrão. No entanto, isso afeta qualquer evento e nível de usuário que você queira analisar na seção Explorações do GA4 ou em um conjunto de relatórios como o Google Data Studio.

Por padrão, o período de retenção de dados é definido como apenas 2 meses. Para alguns dados demográficos – como idade, sexo e interesse – este é o período máximo de retenção. Para eventos e outros dados do usuário, você pode escolher entre o padrão de 2 meses e um máximo de 14 meses.

Isso significa que, se você quiser realizar uma análise de dados com mais de 14 meses, talvez não seja possível fazer isso com o GA4. Um exemplo aqui pode ser a preparação para sua Promoção de verão anual. Você pode querer voltar e analisar o desempenho de sua publicidade para a venda nos últimos anos. Isso não seria realmente possível além dos relatórios básicos fornecidos na interface do usuário do GA4. Isso não é ideal, pois pode haver insights vitais a serem obtidos comparando os últimos anos de dados de campanha.

Outro exemplo aqui pode ser que você suspeite que diferentes faixas etárias sejam mais ativas em seu site em diferentes épocas do ano. Por exemplo, aqueles com 20 e poucos anos podem estar visitando mais seu site de viagens à medida que o ano letivo superior está chegando ao fim. Isso pode ajudá-lo a priorizar quais pacotes de viagem você está exibindo na página inicial do seu site. Com o GA4, você não poderia fazer mais análises sobre essa tendência além do que está nos relatórios padrão. Mesmo olhando para o final do semestre letivo anterior para ter alguma noção, pode não ser possível, pois os dados estarão disponíveis apenas para os últimos 2 meses.

Obviamente, existem algumas boas razões para excluir quaisquer dados que você não precise e que não sirvam mais a um interesse comercial legítimo, pois essa é uma disposição do GDPR e legislações semelhantes. No entanto, o GA4 torna essa janela de 14 meses o máximo e isso não será o caso em muitos casos. Como parte de estar em conformidade com várias legislações e para proteger a privacidade do usuário, certifique-se de ter permissão deles para coletar os dados e que você exponha claramente em sua política de privacidade por que você está coletando seus dados, por quanto tempo você os está armazenando e o que está sendo feito com ele.

Como aumentar o período de retenção?

Há duas etapas de mitigação que você pode seguir para garantir que os dados do GA4 estejam disponíveis para análise. A primeira é uma etapa bastante simples e é alterar seu período de retenção de dados no GA4 de 2 meses para 14 meses.

Você pode fazer isso seguindo estas etapas:

  1. Navegue até sua propriedade do GA4.
  2. Clique em Admin na parte inferior da barra de menu à esquerda
  3. Na coluna Propriedade, clique em Configurações de dados
  4. Selecione Retenção de Dados no novo menu.
  5. Altere o menu suspenso Retenção de dados do evento de 2 meses para 14 meses
  6. Marcar a caixa abaixo garantirá que o período de retenção dos dados do usuário seja redefinido sempre que o usuário visitar. Isso significa que, se um usuário visitar seu site um mês após a primeira visita, os dados específicos do usuário serão removidos apenas 14 meses a partir da segunda visita, e não da primeira.

Conecte o Google BigQuery

A segunda etapa é mais complicada, mas permite garantir que você possa ter todos os dados do evento armazenados além do período de expiração de 14 meses. Isso é para aproveitar um recurso disponível no GA4 que antes estava disponível apenas no Google Analytics 360, a versão empresarial premium do Google Analytics. Esse recurso é um link automatizado com o Google BigQuery. BigQuery é o sistema de armazenamento de dados baseado em nuvem do Google. Ele permite que você armazene e analise grandes quantidades de dados.

A configuração e o gerenciamento do BigQuery e como analisar e recuperar dados estão além do escopo desta postagem, mas podemos mostrar algumas das vantagens e o que esperar.

O BigQuery é uma oferta bastante técnica e envolve a navegação no grande e às vezes confuso Google Cloud Platform e, portanto, na maioria das vezes, é necessário algum conhecimento técnico para configurá-lo e executá-lo. É necessário um conhecimento mais específico para extrair dados dele usando SQL. Mas se você tem alguém com o conhecimento necessário, então é um sistema muito robusto e eficaz de usar.

O BigQuery não é uma oferta gratuita e você pagará por colocar dados no sistema, pela quantidade armazenada e por extrair dados do sistema. Cada uma dessas três ações de pagamento dependerá de vários fatores, incluindo como você está inserindo os dados, como você os está retirando e em quais servidores do Google você os está armazenando. O número de visitantes do site que você tem, quanto de suas atividades você está rastreando, quão imediato você precisa que os dados estejam disponíveis, bem como quanto deles você está extraindo e com que frequência só será contabilizado no custo do sistema.

Em termos de uso dos dados armazenados no BigQuery, ele pode ser conectado ao Google Data Studio. Isso significa que você pode analisar os dados em um ambiente confortável, semelhante a outros relatórios que você configurou lá. Na verdade, você pode ter os dados do BigQuery como a principal fonte de dados usada para analisar os dados do GA4, pois sempre terá, na pior das hipóteses, dados até o dia anterior concluído e todos os dados do evento estarão disponíveis. A fonte de dados do BigQuery não é idêntica à do GA4 e, portanto, você precisará adaptar os relatórios que já possui à nova fonte. Conectar-se diretamente ao BigQuery em vez do GA4 para seus dados mais recentes significa que, com o passar do tempo, você sempre poderá analisar seus dados históricos juntamente com seus novos dados, mesmo depois que os dados mais antigos expirarem no próprio GA4.

Por fim, o BigQuery pode ajudar até certo ponto a garantir que você esteja em conformidade com o GDPR e outras legislações, permitindo que você especifique onde seus dados são armazenados. O Google tem armazenamentos de dados em todo o mundo e você seleciona exatamente qual armazenamento de dados deseja que sua instância do BigQuery seja. Isso significa que, levando em consideração o GDPR ou o Swiss DPA , você pode armazenar seus dados na Europa e não precisa se preocupar com o armazenamento em um país que não possui as proteções de dados equivalentes. Vários locais na Europa e na Suíça podem ser selecionados, cada um com uma estrutura de preços ligeiramente diferente.

Informe-nos se tiver dúvidas sobre a configuração do BigQuery do Google, teremos prazer em atendê-lo.