Google Analytics 4 vs. Universal Analytics. Mik a legfontosabb változások?

Írta:Németh Balázs

2020 októberében a Google hivatalosan is elindította a Google Analytics 4-et (GA4). A GA4 nem az Universal Analytics (UA) frissítése, hanem gyakorlatilag egy teljesen új termék, ami alapjaiban különbözik jól ismert elődjétől.
Számos funkcióbeli különbség mellett olyan izgalmas újításokat tartalmaz, ami nemcsak a felület használatát, hanem a mérés logikáját, így végül jelentéseink tartalmát is befolyásolják. Ebben a cikkben a bemutatjuk a legfontosabb változásokat.

Mérési modell

Lényegében a GA4 első és egyben egyik leglényegesebb megkülönböztető jellemzője az adatmodellben rejlik, amely azon az elven alapul, hogy minden interakció rögzíthető eseményként (event-based).

Ezzel szemben UA munkamenetekbe (session based) csoportosítja az adatokat, és ezek a munkamenetek képezik az összes jelentés alapját. Mára azonban az új mobilalkalmazások és az egyoldalas webalkalmazások nem tudják értelmesen leírni a felhasználói viselkedést ezzel a hagyományos modellel, ezért az új eseményvezérelt adatmodell nagyobb rugalmasságot és egységesebb nyomon követési rendszert biztosít a weben és az alkalmazásokban egyaránt.

Nézetek, adatfolyamok

Az UA-ban a Fiókok – Tulajdonok – Nézetek hierarchia van. A nézetek egy szűrhető egyéni adatszegmens létrehozására szolgálnak, amelynek pratikus felhasználása például egy aldomainhez kapcsolódó forgalom kizárása a jelentésből. Célok és konverziók is beállíthatóak egy adott nézethez.
Ezzel szemben GA4 „adatfolyamokat” tartalmaz az UA tulajdonok által használt nézetek és szegmensek helyett.

GA4 - Tulajdon
GA4 – Tulajdon

Eseménykövetés beállítása

A GA4 adatmodellje sok szempontból rugalmasabb így kevesebb korlátozás és kötelező mező/paraméter van az UA-hoz képest.
Az UA használata esetén az összes nyomon követett eseménynek követnie kell a kategória – művelet – címke – érték sémát, azaz a esemény létrehozásánál kötelezően meg kell adnunk az esemény kategória és művelet paramétereit és hozzá kapcsolhatunk egy címkét és egy értéket. Ezzel a legfőbb probléma a begyűjthető információk mennyiségének korlátozása az UA esetében.
A GA4-ben szerencsére sokkal rugalmasabban kezelhetjük az eseményeink paramétereit, hiszen saját leíró elnevezéseket határozhatunk meg hozzájuk.

Eseménykövetés automatizálása

A GA4 lehetővé teszi bizonyos eseménytípusok automatikus nyomon követését további kódolás/címkézés nélkül, ha a nyomon követni kívánt oldalon lefutott a gtag.js.

A Google Analytics 4-ben négy eseménytípus található:

  • Automatikusan gyűjtött események
  • Továbbfejlesztett mérési események
  • Ajánlott események
  • Egyéni események

Automatikusan gyűjtött események

Az automatikusan összegyűjtött eseményeket a globális webhelycímke küldi el a Google Analytics szolgáltatásba. Nincs szükség további konfigurációra ahhoz, hogy az automatikusan gyűjtött eseményadatok megjelenjenek a jelentésekben.

session_start: Akkor aktiválódik, amikor a felhasználó tevékenységet végez az alkalmazással vagy a webhelyen.
first_visit: Az első alkalom, amikor a felhasználó meglátogatja a weboldalt.
user_engagement: az esemény 10 másodperccel azután aktiválódik, hogy a felhasználó egy oldalon tartózkodott.

Továbbfejlesztett mérési események

Ez a funkció alapértelmezés szerint engedélyezve van, és automatikusan követi a következő eseményeket:

  • Oldalmegtekintés
  • Görgetések
  • Kimenő kattintások
  • Webhelyről indított keresés
  • Videóval kapcsolatos tevékenységek
  • Fájlletöltések
GA4 - Továbbfejlesztett mérés
GA4 – Továbbfejlesztett mérés

Ajánlott eseményeknek

Iparágak szerint vannak csoportosítva, és előre meghatározott nevük és paramétereik vannak. Kategóriáik szerint bizonyos üzleti területeken ajánlják őket, (például kiskereskedelem és e -kereskedelem, utazás, játékok, stb), de természetesen ettől függetlenül is használhatjuk, amennyiben megfelelnek az igényeinknek.

Egyedi események

Ha az eddigi esemény kategóriák között nem találunk olyat, amire szükségünk van, akkor létrehozhatunk egyéni eseményeket is. A beállítása majdnem olyan, mint az ajánlott eseményeké. Az egyetlen különbség, hogy saját eseményneveket kell használnunk.
Az események ilyen szintű kezelése nem lehetséges az UA esetében.

Munkamenet számítás

A munkamenet számítás módszertana alapvetően eltér a UA és a GA4 esetében.

Az UA-ben munkamenet véget ér:

  • 30 perces inaktivitás után,
  • Éjfélkor,
  • vagy ha a kampány, vagy forgalmi forrása megváltozik

A GA4-ben a munkamenet az automatikusan gyűjtött session_start eseményen alapul, és annak időtartamát az első és utolsó eseményének időpontja közötti eltérés határozza meg. Továbbá nem hoz létre új session-t, amikor a kampányforrás a munkamenet közepén megváltozik. Emiatt a GA4 jelentéseiben alacsonyabbak, viszont életszerűbbek is lesznek a munkamenet számok.

A következő példa jól mutatja a két módszertan közötti különbséget:
Felhasználónk az Árukeresőből jut el a webshopunk termékoldalára, amit egy gyors áttekintés után bezár. Néhány perc gondolkodás után újra megnyitja az oldalunkat, de ezúttal már közvetlenül az url-t begépelve, hogy megvegye a terméket.

Míg az UA ezt két munkamenetnek számolja a megváltozott forgalmi forrás miatt, addig a GA4 egy munkamenetként fogja elkönyvelni.

Elköteleződés, visszafordulás

Webhelyünk teljesítményének egy fontos mérőszáma a visszafordulási arány (bounce rate). Volt legalábbis a UA esetében, ugyanis a sokszor téves következtetésekre okot adó mérőszám kikerült a GA4-ből.

Mi is volt a baj a visszafordulási aránnyal? Az, hogy a visszafordulási arány az egyoldalas munkamenetek számát mutatja a webhely összes munkamenetéhez képest, így bizonyos oldalak, vagy tartalmak esetében a magas visszafordulási arány hamisan jelezte azt, hogy a látogatónk nem találta meg a számításait az oldalunkon, annak ellenére, hogy valójában 15 percet töltött egy hasznos cikk elolvasásával.

Ennek a problémának az orvoslására bevezetésre került az elkötelezettségi ráta (engagement rate), ami az elkötelezett munkamentek (engaged sessions) arányát mutatja az összes munkamenetéhez képest. De mi is az az elkötelezett munkamenet?

Először is három feltétel közül egynek legalább teljesülnie kell ahhoz, hogy egy munkamenet elkötelezett munkamenetté váljon.

  • 10 másodpercnél tovább tart,
  • tartalmaznak konverziós eseményt,
  • vagy több oldalmegtekintéssel rendelkeznek.

Ennek köszönhetően a webhelyen való hosszú tartózkodások, amelyek nem eredményeznek további oldalra való kattintást, többé nem tekinthetők elkötelezetlen munkameneteknek, így végül a felhasználói élmény javítását célzó UX design során pontosabb képet kaphatunk a látogatóink viselkedéséről, és oldalunk teljesítményéről is.

Felhasználói és eseményadatok megőrzése

A Google Analyticsben beállítható, hogy mennyi ideig őrizze meg a felhasználó-specifikus adatokat.
Az UA esetében 14, 26, 38, 50 hónap vagy “Ne járjon le automatikusan” beállítási lehetőségeink vannak, míg a GA4-ben csak 2 és 14 hónap között választhatunk.

GA4 - Felhasználói adatok megőrzése
GA4 – Felhasználói adatok megőrzése

IP anonimizálása

A GDPR szerint az IP címek személyazonosításra alkalmas információk, így azok anonimizálása a GDPR-megfelelés egyik legfontosabb technikai feltétele.
A Google Analyticsben ennek megfelelően lehetőség van a felhasználók IP címének anonimizálására, maszkolására. Ez a beállítás az UA-ban alapértelmezetten le van tiltva, de bármikor bekapcsolható, míg a GA4 esetében már automatikusan be van kapcsolva és nem tilthatható le.

BigQuery integráció

A BigQuery egy felhőalapú adattárház, ami lehetővé teszi lekérdezések millióinak kezelését, elemzését a Google kapacitásaira és technológiájára támaszkodva.
A GA4 ingyenes csatlakozással rendelkezik a BigQuery-hez. Így hozzáférhetünk a nyers GA4 adatokhoz, amin SQL lekérdezéseket is indíthatunk a pontosabb adatelemzés érdekében.
Az UA nem rendelkezik ingyenes csatlakozással a BigQuery-hez, csak fizetős Google Analytics 360 felhasználóknak van lehetőségük használni ezt a szolgáltatást.

GA4 - BigQuery összekapcsolása
GA4 – BigQuery összekapcsolása

Referral spam védelem

A Google Analytics esetében a leggyakoribb spam forgalom az úgynevezett Google Analytics Measurement Protocolból származik. A Measurement Protocol egy API, ami lehetővé teszi a webhely forgalomban közvetlenül nem látszódó adatok importálását Analytics fiókba.
Habár ez egy nagyon hasznos eszköz, sajnos a spammerek is előszeretettel használják arra, hogy hamis forgalmat generáljanak a segítségével.
Az UA esetében ehhez elegendő egy tracking ID, ami az egységes formátumnak köszönhetően (UA-XXXXXX-1) gyorsan és véletlenszerűen generálható, így egy automatizált szkript segítségével nagy mennyiségű hamis forgalom küldhető be a Measurement Protocolon keresztül az Analytics fiókunkba.
A GA4 esetében a Measurement Protocolhoz egy titkos kulcsot is generálhatunk, így csak az érvényes kulccsal rendelkező lekérések képesek adatokat küldeni a Google Analytics-be.

Cross-Domain Tracking

A Google Analytics sütikkel követi a felhasználókat, így amikor a látogató egy domainen belül elnavigál az egyik aloldalról a másikra, akkor ezzel a technikával könnyedén lekövethető az útja. A probléma akkor kezdődik, amikor webhelyünkön a kívánt látogatói út az “A” domainünkről a “B” domainünkre vezet. A sütik technológiai korlátja, hogy nem lehet megosztani őket két külön domain között, így alapértelmezés szerint az Analytics két külön látogatót fog elkönyvelni az előbbi esetben.
Szerencsére az UA esetében is megvalósítható a domain szintű követés, azonban ennek a beállítása jelentősen egyszerűsödött a GA4-ben, ugyanis míg az elődjénél ehhez szükségünk volt a Tag Managerre, addig a GA4 esetében ezt már a saját felületén tudjuk elvégezni.

Mintavétel

Nagy mennyiségű adat elemzése esetén bevett gyakorlat a statisztikai mintavétel.
A gyorsabb és költséghatékonyabb adatelemzést lehetővé tevő eljárás lényege, hogy az adathalmazunkból vett minta minőségi és mennyiségi szempontból is reprezentálja azt, vagyis pontosan tükröznie kell annak jellegzetességeit.
Egy egyszerű példával élve egy szakácsnak nem kell megennie az egész lábas levest ahhoz, hogy tudja elsózta, elég csupán egyetlen kanállal megkóstolni belőle.
Hatalmas adathalmazokat generáló nagy forgalmú weboldalak, alkalmazások esetében az Analytics ehhez hasonlóan bizonyos esetekben nem a teljes nyers adatokból állítja össze egyes jelentéseit, hanem mintavétel alapján dolgozik.

GA4 - Mintavételi arány
GA4 – Mintavételi arány

Minél kisebb azonban a minta adatkészlete, annál kevésbé pontosak az eredmények és értelmezések. Ha egy 100 munkamenetes jelentés 1% -os minta alapján készült, akkor az azt jelenti, hogy a becslés 1 munkameneten alapul.

De akkor nézzük is meg, hogy hogyan alakul a mintavételezés a gyakorlatban.
A mintavételezési küszöbérték szempontjából fontos, hogy milyen jelentésről beszélünk. Ha például egy alapértelmezett jelentést kiegészítünk egy szegmenssel, vagy egy másodlagos dimenzióval, vagy csak kellően nagy dátumtartományt kívánunk vizsgálni, akkor az adatok olyan kombinációja jöhet létre, ahol már szükséges lehet a mintavételezési eljárás. Ezeket a jelentéseket nevezzük eseti, vagy ad-hoc jelentéseknek.

Az UA esetében 500 ezer munkamenetig nem alkalmaz mintavételezést, míg a fizetős UA360 esetében 100 millió munkamenet a küszöbérték a kiválasztott dátumtartományban.
Az GA4 nem használ mintavételezést az alapértelmezett jelentéseiben, azaz a teljes adathalmazból dolgozik. Ugyanakkor a Felfedezés alatt található eseti jelentések 10 milliós küszöbértékkel rendelkeznek, azaz az ezt meghaladó számú eseményeknél már történhet mintavételezés.

További olvasmányok

https://wearekemb.com/en/where-did-my-bounce-rate-go-in-google-analytics-4/
https://www.globalmediainsight.com/blog/ga4-event-tracking/
https://www.datadrivenu.com/google-analytics-4-engagement-rate/
https://ken-williams.com/guide/overview/where-did-bounce-rate-go-in-google-analytics-4/
https://www.morevisibility.com/blogs/analytics/bounce-rate-is-being-replaced-in-google-analytics-4-ga4.html
https://www.datadrivenu.com/google-analytics-4-bounce-rate/
https://www.optizent.com/bounce-rate-in-google-analytics-4/
https://www.searchenginejournal.com/how-to-filter-referral-spam-google-analytics/388480/
https://www.owox.com/blog/articles/how-to-avoid-google-analytics-sampling/
https://www.analyticskiste.blog/analytics/ua-ga4-unterschiede-im-vergleich/#Sampling_UA_vs_Sampling_GA4