Magazín ze světa digitálního marketingu
Pozadí vlevo Pozadí vpravo

Data Restart pošesté. Stála konference za návštěvu? 1. část

Jiří Šantora
Jiří Šantora
12. 3. 2020

Data Restart se letos konal již pošesté. Přes 250 účastníků se na začátku března přišlo do Divadla pod Palmovkou přesvědčit, že s přibývajícími lety může zrát nejen víno, ale i konference. Přinášíme vám první část reportu z přednášek. Jak jinak než pěkně analyticky strukturovaně v odrážkách. Pro začátek se můžete mrknout na videoreportáž z akce:

Jiří Štěpán: Soumrak session based analytiky. Co bude dál?

  • Nejrozšířenějším nástrojem je kombinace GA a GTM (cca 80 % ze všech případů).
  • Doprovozené hromadou dalších remarketingových a jiných kódů.
  • Spojené s klasickými chybami, problémy a stížnostmi.

  • Data management zahrnuje několik oblastí. Jednou z nich je Quality Control – jsou nasbíraná data správná a jak moc? Weboví analytici to téměř neřeší.
  • Různé důvody ztrátovosti – špatná implementace, 5 % neprojde různými firewally, 25 % uživatelů má nějaký typ adblocku, 10 % má browsery různě omezující měření apod. Celkem ztrácíme třeba i 25–35 % dat.

  • Dělal experiment, vlastním skriptem si celý rok posílal zcela pravidelně do GA 20 requestů za minutu. Výsledná reportovaná data ale sem tam neseděla, pár výkyvů nahoru i dolů a jiné anomálie, které by tam být neměly.
  • Cookies 3. strany míří do záhuby. Co nezvládlo v roce 2018 GDPR, to od roku 2019 postupně zařezávají samy prohlížeče. S nastupujícími browsery se mění doba. Bude se neustále zvyšovat podíl nezměřených uživatelů. Musíme se přizpůsobit.

  • Možná cesta je analytika orientovaná na uživatele, zákazníky. Technologicky sběr pomocí event-based analytiky, například GA App+Web → BigQuery → Data Studio. Stará dobrá klasická DMP jsou za zenitem, budoucnost patří CDP – Customer data platform, tedy CRM obohacené o eventová data.
  • Stále více se řeší etický aspekt webové analytiky. Data patří uživateli. Konec ignorování GDPR, konec spoléhání se na nástroje postavené na 3rd-party cookies, konec bezhlavého vkládání hromady nekontrolovaných měřicích kódů, konec ukládání uživatelských dat bez kontroly.

Kde jsou limity zákaznické 360°? from Taste Medio

 

Jakub Kříž: Rozhlas v 21. století, online analytika napříč webem i vzduchem

  • Případovka z prostředí implementace projektu analýzy poslechovosti pro Český rozhlas.
  • Specifické prostředí – ČRo má 10 stanic, 14 regionálních + několik webů + podcasty (Apple, Spotify, Bluburry, Podtrac) + mobilní appku rádia Junior + červené tlačítko na TV + YouTube videa. Dohromady okolo 2 milionů posluchačů.
  • Různá omezení a problémy – velmi omezené statistiky YouTube (který má ale víc než 50 % všech poslechnutých pořadů), poslech autorádia se nezměří, část služeb vůbec nemá API apod.

  • Na začátku intenzivní rozhovory uvnitř ČRo. Vyslechli potřeby koncových uživatelů a navrhli pro ně reporty.
  • Technologicky řešení přes GA Web+App (focus na stream dat, není session based) / Firebase → Blaze → Dataprep → BigQuery → Data Studio.
  • Do „červeného tlačítka“ HbbTV lze také implementovat GTM. Ale zpravidla si neudrží cookies.

Rozhlas v 21. století, online analytika napříč webem i vzduchem from Taste Medio

Pavel Krejsa: Analýza dat a predikce chování zákazníků s pomocí Google Cloud

  • Úvod do Google Cloud Platform – přečtěte si na toto téma náš článek Seznamte se s Google Cloud Platform.
  • Machine Learning od Google je postavený na speciálním výkonném hardwaru k tomu určeném (TPU – Tensor Processing Unit).

  • V BigQuery lze vytvořit i vyhodnotit predikční model a dále s ním pracovat v rámci standardního SQL dotazu (BigQuery ML) – příkazy jako CREATE MODEL, ML.EVALUATE nebo ML.PREDICT
  • Praktický příklad – výpočet pravděpodobnosti dalšího nákupu zákazníka, ukázka nad anonymizovanými daty z Google Merchant Store.
  • Rozdělíme dataset na tréninkový a evaluační.
  • Naše práce = musíme určit, jaké proměnné mají vliv na pravděpodobnost nákupu.

  • Pro začátek zkusíme jako vysvětlující proměnné celkový počet bounců a čas na stránce. Mají docela nevhodné rozložení první je skoro pořád nula, druhé má zase velký rozptyl. Ale i tak po 3 minutách učení máme vytrénovaný model, který dovede na 72 % předpovědět další nákup uživatele.
  • Po přidání dalších vysvětlujících proměnných (zdroj návštěvy, země, typ zařízení, počet pageviews) se dostaneme na 91% přesnost.
  • Co s tím dál – spouštět každý den, vytvořit si na predikované uživatele audienci a cílit na ně v Google Ads, oslovit ne napřímo e-mailem nebo personalizovaným sdělením na webu.
  • Vedle takového rychlého předdefinovaného naučení můžu do BigQuery importovat i celý svůj hotový komplexní model z TensorFlow.

Pokračování příště

V pokračování článku se podíváme na další řečníky z letošního Data Restartu. A co vy, byli jste na konferenci? Která přednáška nejvíc zaujala vás?

Sdílejte článek

Související články