Jak połączyć GA4 z BigQuery

Jak połączyć GA4 z BigQuery i zwiększyć możliwości analizy danych na stronie?

Ze wszystkich stron słyszymy, że to właśnie dane powinny być podstawą ważnych decyzji biznesowych. Do ich efektywnego przetwarzania potrzeba jednak odpowiednich narzędzi, a GA4 nie zawsze jest wystarczającym rozwiązaniem. Na szczęście dzięki integracji usługi z BigQuery można znacząco zwiększyć jej możliwości. Dowiedz się, kiedy i dlaczego warto postawić na integrację i sprawdź, jak wyeksportować dane, aby w pełni wykorzystać z możliwości obu tych narzędzi.

Czym jest BigQuery?

BigQuery to usługa od Google, która pozwala przechowywać i szybko przetwarzać ogromne ilości danych. Można dzięki niej  analizować dane z różnych źródeł, w tym z GA4, bez konieczności posiadania własnej infrastruktury serwerowej.

 

Integracja GA4 z BigQuery opłaca się firmom z wielu powodów. Umożliwia m.in.:

  • analizowanie danych w czasie rzeczywistym,
  • lepsze zrozumienie zachowań użytkowników,
  • bardziej efektywne zarządzanie kampaniami marketingowymi,
  • podejmowanie lepszych decyzji biznesowych na podstawie dokładniejszych danych,
  • ograniczenie kosztów utrzymania infrastruktury IT (BigQuery działa w modelu pay-as-you-go, co oznacza, że firmy płacą jedynie za rzeczywiste zużycie zasobów).

BigQuery pozwala też rozwiązać wiele problemów wynikających z ograniczeń GA4. Pojawiają się one zazwyczaj, gdy firma zaczyna się rozwijać i tym samym gromadzić więcej danych. GA4 może sobie nie poradzić z ich efektywnym przetwarzaniem. Wtedy rozwiązaniem jest BigQuery.

 

Aby zacząć korzystać z tego rozwiązania, trzeba jednak wcześniej wyeksportować dane z Google Analytics. Z kolejnego akapitu dowiesz się jak to zrobić.

Jak połączyć usługę GA4 z BigQuery?

1. Pierwszym krokiem do połączenia tych usług jest założenie nowego projektu na platformie Google Cloud. Można to zrobić, klikając w ten link https://console.cloud.google.com/bigquery. Następnie należy utworzyć nowy projekt, wybierając opcję “My Project” w lewym górnym rogu.

 Następnie klikamy w “Nowy projekt” w oknie, które się pojawiło.

W nowej karcie należy nadać nowemu projektowi nazwę i zatwierdzić jego utworzenie.

Założenie nowego projektu na platformie Google Cloud.

2. W dalszej kolejności należy przejść do usługi GA4. W sekcji “Administracji”, konkretniej w sekcji “Połączenia usług” wybieramy “Połączenia z BigQuery” i klikamy “Połącz”.

3. W wyświetlonym oknie klikamy w “Wybierz projekt BigQuery”. Potem z listy wybieramy utworzony projekt i akceptujemy go.

Wybierz projekt BigQuery

4. Następnym krokiem jest wybranie regionu, w którym chcemy przechowywać dane (jeżeli zamierzamy je łączyć z innymi danymi, należy wybrać ten sam region, ponieważ późniejsze łączenie danych z różnych regionów jest bardzo trudne lub nawet niemożliwe) oraz strumienia danych z naszej usługi.

Wybieranie regionu w BigQuery

5. Ostatnie, co należy zrobić, to wybrać typ eksportu. W zależności od potrzeb może to być tryb dzienny lub strumieniowy. Eksport dzienny polega na przesyłaniu danych raz dziennie po zakończonej dobie, natomiast strumieniowy na przesyłaniu danych w czasie rzeczywistym, zaraz po tym jak pojawiły się w usłudze GA4. Warto jednak wiedzieć, że eksport strumieniowy jest dodatkowo płatny, dlatego jeżeli nie planujemy śledzić danych w czasie rzeczywistym, eksport dzienny będzie wystarczający.

Tryb eksportu BigQuery

6. Na koniec należy kliknąć w przycisk “prześlij” i  poczekać, aż pierwsze dane z GA4 pojawią się w projekcie, co może potrwać do 24 godzin.

Aby dokonać połączenia GA4 i BigQuery, trzeba mieć odpowiednie uprawnienia. W usłudze GA4 należy mieć rolę edytora lub administratora, natomiast w BigQuery rolę uprawniającą do zarządzania projektem (np. bigquery.admin lub bigquery.dataEditor)

Kiedy warto przechowywać dane w BigQuery?

Przechowywanie danych w hurtowni ma wiele zalet. Wśród nich jest nieograniczony dostęp do surowych danych, możliwość łączenia danych z GA4 z innymi źródłami jak na przykład CRM czy opcja połączenia usługi z narzędziami do tworzenia zaawansowanych dashboardów.

Oto kilka przykładów, kiedy dane w BigQuery mogą okazać się bardzo pomocne:

  • Gdy w dokładnej analizie przeszkadzają wiersze (other)

Wiersze (other) pojawiają się w raportach, gdy do jednego wymiaru przypisanych jest za dużo wartości (nie ma konkretnych limitów, wiersz (other) może pojawić się już przy 500 różnych wartościach). Do takich sytuacji dochodzi czasem w sklepach internetowych, które mają w ofercie bardzo dużo produktów oraz na portalach newsowych. Za każdym razem uniemożliwia to dokładną analizę danych. BigQuery rozwiązuje ten problem, ponieważ nie występują tam żadne ograniczenie związane z liczbą wartości. 

  • Gdy w raportach GA4 pojawiają się anomalie

Zdarza się, że w raportach GA4 widoczne są nietypowe spadki lub wzrosty różnych danych. Prześledzenie tych anomalii w GA4 bywa niemożliwe ze względu na próbkowanie, progowanie, czy modelowanie danych. Dlatego warto wtedy skorzystać z BigQuery, gdzie znajdują się pełne surowe dane. 

  • Gdy w Lookerze pojawia się błąd limitu

Do analizy danych z GA4 często wykorzystuje się Looker Studio,  czyli narzędzie Google, przy pomocy którego można wizualizować dane dotyczące witryny bądź aplikacji. Jednak w przypadkach, gdy taki dashboard jest bardzo rozbudowany, może pojawić się problem z limitem wykorzystywanych danych. Rozwiązaniem  jest połączenie dashboardu z BigQuery, ponieważ tam nie występują limity w przesyłaniu danych. 

  • Gdy chcesz robić zaawansowane analizy, które będą obejmowały więcej niż 14 miesięcy

GA4 pozwala tworzyć własne raporty, które mogą być bardziej zaawansowane i  dopasowane do potrzeb (wykonuje się je w zakładce eksploracje). Jednak w standardowych usługach GA4 można tam wykorzystywać dane z maksymalnie ostatnich 14 miesięcy (dla usług 360 jest to maksymalnie 50 miesięcy), co w wielu przypadkach jest niewystarczające. Na przykład, nie można tam porównać danych z całego roku w stosunku do roku poprzedniego. W takich przypadkach warto skorzystać z BigQuery, gdzie takie ograniczenia nie występują. 

  • Gdy raporty możliwe do stworzenia w GA4 są zbyt ograniczające

Pomimo możliwości tworzenia zaawansowanych raportów w eksploracjach może się okazać, że to i tak za mało. Występują tam ograniczenia w łączeniu niektórych wymiarów oraz danych, a maksymalna liczba wierszy, jaką można wyświetlić to 500. Znając strukturę danych, w jakiej są przechowywane dane, BigQuery daje możliwość tworzenia dodatkowych połączeń, niemożliwych do wykonania w GA4, bez ograniczeń do liczby wierszy. 

  • Gdy chcesz stworzyć dokładny profil klientów

Dane w GA4 dają nam wiele informacji o klientach, na podstawie których można analizować ich zachowania zakupowe. Jednak czasem te dane mogą okazać się niewystarczające. Wówczas dobrym rozwiązaniem jest połączenie ich z danymi z CRM, takimi jak, np. zapis do newslettera, data pierwszej transakcji czy częstotliwość kontaktów telefonicznych.

Dla zaawansowanych:

  • Gdy chcesz tworzyć modele predykcyjne lub klasyfikacyjne

Po przeniesieniu danych z GA4 do BigQuery można  tworzyć modele do analizy danych, korzystając z funkcji BigQuery ML (Machine Learning). Wystarczy w tym celu zastosować standardowe zapytania SQL. Dzięki tej funkcji można tworzyć m.in. modele predykcyjne prognozujące przychody czy modele klasyfikacyjne, które tworzą grupy odbiorców. 

 

Sprawdź, jakie są najczęstsze problemy z GA4 i ich rozwiązania.

Kiedy BigQuery nie pomoże?

Podstawą analizy danych przy wykorzystaniu BQ jest poprawność zebranych danych. W przypadku gdy w GA4 dane zbierają się nieprawidłowo, na przykład ze względu na błędną konfigurację, przesyłanie ich do hurtowni nic nie da. Dlatego przed połączeniem tych usług należy sprawdzić, czy zdarzenia się nie duplikują, czy przesyłane są wszystkie oczekiwane parametry, i nie tylko. 

 

Warto wiedzieć również, że dane są przesyłane do BigQuery dopiero od momentu połączenia go z usługą GA4. Co za tym idzie, nie ma możliwości analizy danych historycznych, mimo iż są one widoczne w panelu GA4. Warto więc zadbać o takie połączenie jak najszybciej, aby mieć dostęp do większej ilości danych historycznych. 

 

Sprawdź, co warto wiedzieć o zdarzeniach w GA4 i analizuj dane lepiej.

 

BigQuery nie rozwiąże także problemu braku danych, będącego efektem polityki prywatności. Jeżeli użytkownicy nie wyrażą zgody na zbieranie i przetwarzanie danych, nie będą one widoczne w panelu GA4, natomiast w BigQuery będą pokazywać się jedynie anonimowe zdarzenia (bez identyfikatora użytkownika). Na ich podstawie nie da się określić, przez jaką liczbę użytkowników zostały wywołane oraz jak wyglądała ich ścieżka. 

Ile kosztuje BigQuery

Koszty w BigQuery można podzielić na dwie główne składowe: koszty magazynowania danych oraz koszt zapytań. Ich wysokość jest zależna od liczby przechowywanych i przetwarzanych danych. Ta natomiast zależy od liczby zdarzeń, które mamy w GA4 i chcemy przechowywać w hurtowni. 

 

Koszty magazynowania możemy dodatkowo podzielić na aktywne przechowywanie (Active storage) oraz długoterminowe przechowywanie danych (Long-term storage).

  • Aktywne przechowywanie danych dotyczy tabel, które były modyfikowane przez ostatnie 90 dni i obecnie kosztuje 0,02 USD za GiB miesięcznie, przy czym pierwsze 10 jest darmowe. Aktualny koszt można sprawdzić na tej stronie. 
  • Przechowywanie długoterminowe dotyczy natomiast tabel niemodyfikowanych przez 90 dni i jest około 50% tańsze niż aktywne. Warto jednak zaznaczyć, że jest ono w takim samym stopniu wydajne, trwałe i dostępne jak przechowywanie aktywne.

Google oferuje różne możliwości rozliczeń za zapytania. Najpopularniejszym z nich jest On-demand pricing, czyli opłata za każde przetworzone żądanie. W tym przypadku za każdy TiB trzeba zapłacić 6,25 USD, przy czym pierwszy TiB jest darmowy. Dodatkowo każda nowa usługa Google Cloud Platform dostaje od Google na początku 300 USD do wykorzystania.

Jak obniżyć koszty BigQuery?

Jak już wiesz, koszty BigQuery w głównej mierze zależą od liczby przechowywanych danych. Im więcej zdarzeń z GA4 będzie wysyłanych do hurtowni, tym koszt będzie wyższy. Dlatego wdrożenie BigQuery jest świetną okazją do zrobienia audytu zdarzeń w Google Analytics. Może się wówczas okazać, że wiele zdarzeń, które są zbierane w GA4, nie jest wykorzystywanych w późniejszej analizie. Takie zdarzenia należy wykluczyć przy łączeniu GA4 z BigQuery, aby nie generowały niepotrzebnych kosztów. 

Skorzystaj z naszego darmowego AutoAudytu, aby sprawdzić, czy twoja usługa GA4 działa prawidłowo!

Kolejnym sposobem na obniżenie kosztów jest optymalizacja zapytań w taki sposób, aby przetwarzane były tylko dane, które rzeczywiście są potrzebne. Podczas tworzenia zapytania należy wybrać tylko te kolumny tabel, które są niezbędne. Warto również pamiętać o określeniu konkretnych dat, aby zawęzić analizowany obszar. Przed wykonaniem każdego zapytania warto spojrzeć na pasek znajdujący się powyżej. Będzie tam widoczna wielkość analizowanego zbioru, a co za tym idzie jego koszt. Choć brzmi to prosto, w praktyce wcale takie nie jest. Tworzenie poprawnych zapytań  wymaga bardzo dobrej znajomości struktury tabel zawierających dane  z GA4. Dlatego, stojąc przed takim wyzwaniem, najlepiej skonsultować się z doświadczonym specjalistą.  

Jeśli potrzebujesz konsultacji albo pakietu usług analitycznych, wypełnił formularz, a my zaproponujemy rozwiązanie dopasowane do twoich potrzeb

Autorka tekstu

W codziennej pracy zręcznie żongluje danymi, analizuje raporty i wdraża oraz dostosowuje narzędzia niezbędne dla efektywnej współpracy naszej agencji z klientami. Swoje życie łączy pomiędzy Wrocławiem a Suwałkami, a prywatnie jest dumną właścicielką oraz fanką swoich psów — Lee Sin i Leony.

Ania Szewczyk

Web Analyst

Udostępnij:

Możemy Ci pomóc w zakresie digital marketingu?

Porozmawiajmy!