Magazín ze světa digitálního marketingu
Pozadí vlevo Pozadí vpravo

AI Inside Out #88: Jak s AI identifikovat nekvalitní návštěvnost na webu?

Jan Synek
Jan Synek
3. 7. 2025
Zbyšek Rusnák
Zbyšek Rusnák
3. 7. 2025

O využití AI v PPC kampaních jsme napsali už mnoho článků. Možnosti práce s umělou inteligencí ale nebere konce. Pracujeme díky ní efektivněji, ale také posouváme business klientů na vyšší úroveň. Tentokrát jsme se podívali za hranici reklamních systémů a zaměřili jsme se na celkovou kvalitu návštěvnosti na webu. A výsledek? Komplexní analýza návštěvnosti pro vybraného klienta provozujícího e-shop napříč zdroji, demografickými údaji a dalšími dimenzemi.

AI Inside Out #88: Jak s AI identifikovat nekvalitní návštěvnost na webu?

ChatGPT (konkrétně model o4-mini-high) ji skloubil za pár chvil a určitě pro ní u klienta najdeme využití. Je ovšem třeba dodat, že je důležité poskytnout jazykovým modelům co nejvíce kontextu, případně s kroky, které z analýzy vzejdou dále pracovat. V tomto článku vám prakticky ukážeme, jak jsme k takové analýze přistoupili, aby měla opravdu co největší přidanou hodnotu.

Cíl analýzy webu

Cílem bylo na základě dat z Google Analytics 4 (GA4) a s využitím ChatGPT identifikovat nekvalitní návštěvnost na úrovni široké škály dimenzí. Takováto data pak můžeme využít vícero způsoby. Může to být například vylučování určitých uživatelů či regionů z reklamních kampaní nebo přehodnocení přístupu k lokalizaci webu. Například můžeme zjistit, že určité jazykové mutace webu nefungují správně. Pojďme se nyní zaměřit na jednotlivé kroky, které bylo potřeba projít.

Postup analýzy

V následujících odstavcích popisujeme, jaké kroky byly k úspěšnému dokončení analýzy potřeba. Můžete je tedy brát jako podrobný návod k její tvorbě.

Definice metrik a prahových hodnot

Nejprve bylo nutné si definovat rozhodují metriky, na jejichž základě budeme návštěvnost klasifikovat jako kvalitní, či nekvalitní. Jelikož se jednalo o e-commerce klienta, vcelku jasně jsme zvolili Engagement Rate a Key Event Rate.

Dále jsou dvě možnosti, buďto si určit prahového hodnoty na základě už definovaných KPIs (Key Performance Indicators) nebo si s jejich určením nechat poradit. V rámci maximalizace využití AI jsme v tomto případě zvolili druhou možnost s tímto výsledkem.

Prahové hodnoty pro metriky konverzní poměr a míry zapojení určené k analýze kvality návštěvnosti za GA4 díky ChatGPT

Prahové hodnoty pro metriky konverzní poměr a míry zapojení

Výběr hodnocených dimenzí

Jako další krok bylo potřeba vybrat v GA4 dimenze, jež budeme hodnotit. Primárně jsme se zaměřili na takové dimenze, s nimiž jsme mohli v kampaních nebo na webu reálně pracovat. Výsledná podoba dimenzí tedy byla následovná:

  •  lokalita
  • čas návštěvy
  • zařízení
  • (zdroj) source / medium
  • zařízení
  • jazyk
  • prohlížeč

Import dat do ChatGPT

Toto je velmi důležitá část. Aby analýza byla co nejpřesnější, bylo třeba poskytnout ChatGPT session-level data (data na úrovni session_id), které jsme exportovali z BigQuery. Zde jsou důvody proč:

  • více podrobností a kontextu
  • flexibilní a přesné filtry
  • možnost odhalit odchylky a anomálie
  • více možností pro vlastní segmentaci
  • přesnější výpočty odvozených metrik
  • jednodušší dlouhodobé porovnání a automatizace

Zjednodušeně řečeno, session-level data by byl například záznam z bezpečnostní kamery, kdežto agregovaná data by byla souhrnná statistika, tedy kolik lidí dnes prošlo dveřmi. Do ChatGPT jsme tedy nahráli CSV soubor se session-leven daty za duben 2025. Určili jsme, že budeme brát v potaz pouze segmenty, které mají alespoň 500 návštěv.

Jak vypadal výstup

Výstup od ChatGPT byl velmi komplexní a obsahoval velmi objemné tabulky. Pro účely článku jsme tedy výstup značně zjednodušili a omezili na maxima a minima. Pojďme se nyní podívat na základní zjištění, které nám ChatGPT dokázal vygenerovat formou jednoduchých tabulek.

První tabulka ukazuje nejlepší a nejhorší segmenty na základě míry zapojení.

Nejvýkonnější segmenty dle míry zapojení na základě dat z GA4 a analýzy ChatGPT

Nejvýkonnější segmenty dle míry zapojení

Druhá tabulka ukazuje nejlepší a nejhorší segmenty na základě konverzního poměru.

Nejvýkonnější segmenty dle konverzního poměru na základě dat z GA4 a analýzy ChatGPT

Nejvýkonnější segmenty dle konverzního poměru

Poslední tabulka ukazuje souhrnné hodnoty, vypočítané jako kombinace míry zapojení a konverzního poměru. Konkrétně využívá hodnotu „Combined (%)“, která ukazuje, jaký podíl návštěv byl současně „engaged“ a měl klíčovou událost (nákup).

Nejvýkonnější segmenty dle konverzního poměru a míry zapojení na základě dat z GA4 a analýzy ChatGPT

Nejvýkonnější segmenty dle konverzního poměru a míry zapojení

Z tabulek výše jsme tedy získali maxima a minima pro jednotlivé segmenty. V rámci snahy o hlubší analýzu, konkrétní akční kroky a propojení dat jsme nakonec oprostili od tabulek (tedy nejhorších a nejlepších segmentů) a podívali jsme se znovu na širší vzorek dat. Samozřejmě za pomocí ChatGPT.

Co jsme zjistili?

ChatGPT uvedl, že:

  • jednoznačně vyniká traffic z porovnávače Zboží.cz, kde téměř 87 % návštěv splňuje podmínku vysokého zapojení a zároveň přináší více než 5 % konverzi, což z něj dělá nejefektivnější zdroj návštěvnosti,
  • výrazně nadprůměrný výkon mají také anglické jazykové verze „en-us“ a „en-gb“, které si drží míru zapojení kolem 72–65 % a konverzní kolem 3 %,
  • ze zařízení se nejlépe daří desktopu, který vykazuje stabilní míru zapojení 73,8 %  a konverzní poměr 2,5 %,  a kombinace desktopu s nočními hodinami (cca 0:00–1:00) pak maximálně využívá nižší konkurenci při zachování vysoké ochoty nakupovat,
  • mezi nejméně výkonné segmenty patří in-app reklamy na Seznamu a Facebooku, kde se téměř žádné návštěvy nepromění v nákup (konverzní poměr kolem 0–0,3 %), a mobilní Safari (in-app), kde se míra zapojení pohybuje pod 62 % a přestože uživatelé stráví nějaký čas na webu, konverzní podíl zůstává kolem 2 %,
  • regionálně ztrácí efektivitu Ostrava a Kladno – ačkoliv míra zapojení v Ostravě dosahuje cca 76 %, konverzní poměr je nízký (~1,9 %), což znamená, že mnoho zájemců pouze prochází stránku, aniž by nakoupilo,
  • z časových úseků se neosvědčují především 10:00 (míra zapojení ~75 %, konverzní poměr ~1,9 %) a 15:00 (míra zapojení ~71 %, konverzní poměr ~2,5 %), kdy je nejnižší kombinace zapojení a nákupní aktivity.

Nyní jsme tedy měli základní fakta. Dalším krokem potom bylo získat od ChatGPT konkrétní doporučení a akční kroky, aby bylo možné získanou analýzu využít. Zde je výsledek, se kterým ChatGPT přišel:

  • Snižte rozpočet na in-app reklamy (Seznam, FB) a přesuňte část investic na „zbozi / product“.
  • Přesvědčte se, že v nočních hodinách (0:00–1:00) neprobíhá údržba či aktualizace, která by mohla zpomalit stránky.
  • Optimalizujte českou verzi (cs-cz): přidejte jasné CTA a zrychlete checkout pro tablet.
  • Zkontrolujte měření v mobilním Safari (in-app) a zajistěte rychlé načítání klíčových skriptů.
  • Přesuňte vyšší bidy do nočních a ranních hodin (0:00–1:00, 9:00–10:00), omezte je ve 10:00 a 15:00.
  • Zaměřte PPC kampaně na anglické trhy (en-us, en-gb) a cílení na desktop v Praze a Brně.
  • Nasadťe lokální bannery pro Ostravu a Kladno s regionálními nabídkami (např. „doručení zdarma“).

Důležitý byl vlastní pohled

V rámci tohoto článku ze sekce AI Insight Out jsme se primárně zaměřili na využití ChatGPT. Proto i doporučení, která z analýzy vyšla jsou generována právě AI.

Je důležité si uvědomit, že velké LM (Language Models, tedy jazykové modely) mají sice velké množství dat a dokáží je rychle zpracovávat, ale nemusí mít vždy přesný kontext k danému klientovi. Proto je nezbytné dívat se na tato doporučení kriticky, ale hlavně, nespoléhat se pouze na ně, nýbrž snažit se na základě získaných poznatků přicházet také z vlastními.

Sdílejte článek

Související články