Rozwiązanie jednego z największych problemów w Google Analytics 4: Przechowywanie danych

Opublikowany: 2022-01-20

Niedawno opublikowaliśmy post na blogu , w którym podkreśliliśmy niektóre z rzeczy, których nauczyliśmy się w ciągu ostatniego roku od oficjalnej premiery Google Analytics 4. GA4 ma wiele naprawdę świetnych punktów sprzedaży. Jest jednak kilka funkcji, których nadal brakuje, a także jeden lub dwa problemy z jego istniejącą funkcjonalnością. W naszym poście skupiliśmy się na jednym z nich, a mianowicie na stosunkowo krótkim okresie retencji niektórych danych w systemie.

Krótszy okres retencji w GA4

Jak wspomniano, problem, który mamy, dotyczy krótszego okresu przechowywania określonych danych w GA4. Nie ma to wpływu na dane zbiorcze widoczne w raportach standardowych. Ma to jednak wpływ na każde zdarzenie i poziom użytkownika, które możesz chcieć przeanalizować w sekcji Eksploracje w GA4 lub w pakiecie raportowania, takim jak Studio danych Google.

Domyślnie okres przechowywania danych wynosi tylko 2 miesiące. W przypadku niektórych danych demograficznych – takich jak wiek, płeć i zainteresowania – jest to maksymalny okres przechowywania. W przypadku danych o wydarzeniach i innych danych użytkownika możesz wybrać między domyślnym 2 miesiącem a maksymalnie 14 miesiącami.

Oznacza to, że jeśli chcesz przeprowadzić analizę danych starszych niż 14 miesięcy, możesz nie być w stanie tego zrobić za pomocą GA4. Przykładem może być przygotowanie do corocznej letniej wyprzedaży. Możesz wrócić i przyjrzeć się skuteczności reklam w sprzedaży w ciągu ostatnich kilku lat. Nie byłoby to możliwe poza podstawowymi raportami dostarczanymi w interfejsie użytkownika GA4. Nie jest to idealne rozwiązanie, ponieważ porównanie danych z ostatnich kilku lat może przynieść istotne spostrzeżenia.

Innym przykładem może być podejrzenie, że różne grupy wiekowe są bardziej aktywne w Twojej witrynie o różnych porach roku. Na przykład osoby w wieku 20 lat mogą częściej odwiedzać Twoją witrynę podróżniczą, gdy rok szkolny dobiega końca. Może to pomóc w ustaleniu priorytetów, które pakiety podróżne są wyświetlane na stronie głównej witryny. Dzięki GA4 nie będziesz w stanie przeprowadzać już analizy tego trendu poza tym, co znajduje się w standardowych raportach. Nawet spojrzenie na koniec poprzedniego semestru szkolnego może nie być możliwe, ponieważ dane będą dostępne tylko za ostatnie 2 miesiące.

Oczywiście istnieją dobre powody, aby usunąć wszelkie dane, których nie potrzebujesz i które nie służą już uzasadnionemu interesowi biznesowemu, ponieważ jest to przepis RODO i podobne przepisy. Jednak GA4 sprawia, że ​​to 14-miesięczne okno jest maksymalne i w wielu przypadkach tak się nie stanie. W ramach przestrzegania różnych przepisów i ochrony prywatności użytkowników upewnij się, że masz od nich pozwolenie na zbieranie danych oraz że jasno określisz w swojej polityce prywatności, dlaczego zbierasz ich dane, jak długo je przechowujesz, oraz co się z nim dzieje.

Jak wydłużyć okres retencji?

Istnieją dwa kroki łagodzące, które możesz podjąć, aby upewnić się, że masz dane GA4 dostępne do analizy. Pierwszy jest dość prostym krokiem i polega na zmianie okresu przechowywania danych w GA4 z 2 miesięcy na 14 miesięcy.

Możesz to zrobić, wykonując następujące kroki:

  1. Przejdź do swojej usługi GA4.
  2. Kliknij Administrator na dole lewego paska menu
  3. W kolumnie Właściwość kliknij Ustawienia danych
  4. Z nowego menu wybierz opcję Przechowywanie danych.
  5. Zmień listę rozwijaną przechowywania danych o zdarzeniach z 2 miesięcy na 14 miesięcy
  6. Zaznaczenie poniższego pola zapewni, że okres przechowywania danych użytkownika będzie resetowany za każdym razem, gdy użytkownik odwiedza. Oznacza to, że jeśli użytkownik odwiedzi Twoją witrynę miesiąc po pierwszej wizycie, jego dane użytkownika zostaną usunięte dopiero po 14 miesiącach od drugiej wizyty, a nie od pierwszej.

Połącz z Google BigQuery

Drugi krok jest bardziej skomplikowany, ale pozwala upewnić się, że wszystkie dane dotyczące wydarzenia są przechowywane po upływie 14-miesięcznego okresu wygaśnięcia. Ma to na celu skorzystanie z funkcji dostępnej w GA4, która była wcześniej dostępna tylko w Google Analytics 360, profesjonalnej wersji Google Analytics dla przedsiębiorstw. Ta funkcja to automatyczne łącze z Google BigQuery. BigQuery to oparty na chmurze system hurtowni danych Google. Pozwala przechowywać i analizować duże ilości danych.

Konfiguracja i zarządzanie BigQuery oraz sposób analizowania i pobierania danych wykracza poza zakres tego posta, ale możemy przedstawić Ci niektóre z zalet i tego, czego możesz się spodziewać.

BigQuery to oferta dość techniczna i obejmuje poruszanie się po dużej, a czasami mylącej platformie Google Cloud, dlatego w większości przypadków do jej skonfigurowania i uruchomienia potrzebna jest pewna wiedza techniczna. Aby wyodrębnić z niego dane za pomocą SQL, wymagana jest bardziej szczegółowa wiedza. Ale jeśli masz kogoś z wymaganą wiedzą, jest to bardzo solidny i skuteczny system.

BigQuery nie jest ofertą darmową i płacisz za wprowadzanie danych do systemu, za przechowywaną ilość oraz za pobieranie danych z systemu. Każda z tych trzech czynności płatniczych będzie zależeć od wielu czynników, w tym od tego, jak wprowadzasz dane, jak je pobierasz i na których serwerach Google je przechowujesz. Liczba odwiedzających Twoją witrynę, ile ich aktywności śledzisz, jak natychmiast potrzebujesz, aby dane były dostępne, a także ile z nich wydobywasz i jak często będzie to tylko uwzględniać koszt systemu.

Jeśli chodzi o wykorzystanie danych przechowywanych w BigQuery, można je połączyć z Google Data Studio. Oznacza to, że możesz analizować dane w wygodnym środowisku, podobnym do innych skonfigurowanych tam raportów. W rzeczywistości możesz mieć dane BigQuery jako główne źródło danych używane do analizowania danych GA4, ponieważ zawsze będą mieć, w najgorszym przypadku, dane do poprzedniego zakończonego dnia, a wszystkie dane dotyczące wydarzeń są dostępne. Źródło danych BigQuery nie jest identyczne ze źródłem GA4, więc musisz dostosować wszystkie raporty, które już masz, do nowego źródła. Łączenie się w celu uzyskania najnowszych danych bezpośrednio z BigQuery zamiast GA4 oznacza, że ​​w miarę upływu czasu zawsze będziesz w stanie przeanalizować dane historyczne wraz z nowymi danymi, nawet po wygaśnięciu starszych danych w samym GA4.

Wreszcie BigQuery może w pewnym stopniu pomóc w zapewnieniu zgodności z RODO i innymi przepisami, umożliwiając określenie miejsca przechowywania danych. Google ma magazyny danych na całym świecie i wybierasz dokładnie, który magazyn danych ma być Twoją instancją BigQuery. Oznacza to, że biorąc pod uwagę RODO lub szwajcarski DPA , możesz przechowywać swoje dane w Europie i nie musisz się martwić, że będą przechowywane w kraju, który nie ma równoważnej ochrony danych. Można wybrać kilka lokalizacji w całej Europie i Szwajcarii, z których każda ma nieco inną strukturę cenową.

Daj nam znać, jeśli masz pytania dotyczące konfiguracji BigQuery Google, chętnie pomożemy.