Data Restart se letos konal již pošesté. Přes 250 účastníků se na začátku března přišlo do Divadla pod Palmovkou přesvědčit, že s přibývajícími lety může zrát nejen víno, ale i konference. Přinášíme vám část reportu z přednášek. Jak jinak než pěkně analyticky strukturovaně v odrážkách. Pro začátek se můžete mrknout na videoreportáž z akce:
Jiří Štěpán: Soumrak session based analytiky. Co bude dál?
- Nejrozšířenějším nástrojem je kombinace GA a GTM (cca 80 % ze všech případů).
- Doprovozené hromadou dalších remarketingových a jiných kódů.
- Spojené s klasickými chybami, problémy a stížnostmi.
Google Analytics bingo od @jiristepan z @etneteractivate v přednášce na konferenci #datarestart. Kdo má vyškrtáno úplně všechno? pic.twitter.com/KlTIYrES0t
— Digichef (@digichefcz) March 5, 2020
- Data management zahrnuje několik oblastí. Jednou z nich je Quality Control – jsou nasbíraná data správná a jak moc? Weboví analytici to téměř neřeší.
- Různé důvody ztrátovosti – špatná implementace, 5 % neprojde různými firewally, 25 % uživatelů má nějaký typ adblocku, 10 % má browsery různě omezující měření apod. Celkem ztrácíme třeba i 25–35 % dat.
Nowadays there is 25-35% data loss due to firewalls, ad blockers and incorrect implementation etc. -> data quality is important #data #datarestart #dataquality pic.twitter.com/Z8cziqHFRf
— Lukas Teply (@LukasTeply) March 5, 2020
- Dělal experiment, vlastním skriptem si celý rok posílal zcela pravidelně do GA 20 requestů za minutu. Výsledná reportovaná data ale sem tam neseděla, pár výkyvů nahoru i dolů a jiné anomálie, které by tam být neměly.
- Cookies 3. strany míří do záhuby. Co nezvládlo v roce 2018 GDPR, to od roku 2019 postupně zařezávají samy prohlížeče. S nastupujícími browsery se mění doba. Bude se neustále zvyšovat podíl nezměřených uživatelů. Musíme se přizpůsobit.
Think in CDP
Change the source of truth from GA to BigQuery@JiriStepan #datarestart pic.twitter.com/bH4EqKXIof— Tomáš Komárek (@Komarekhk) March 5, 2020
- Možná cesta je analytika orientovaná na uživatele, zákazníky. Technologicky sběr pomocí event-based analytiky, například GA App+Web → BigQuery → Data Studio. Stará dobrá klasická DMP jsou za zenitem, budoucnost patří CDP – Customer data platform, tedy CRM obohacené o eventová data.
- Stále více se řeší etický aspekt webové analytiky. Data patří uživateli. Konec ignorování GDPR, konec spoléhání se na nástroje postavené na 3rd-party cookies, konec bezhlavého vkládání hromady nekontrolovaných měřicích kódů, konec ukládání uživatelských dat bez kontroly.
Jakub Kříž: Rozhlas v 21. století, online analytika napříč webem i vzduchem
- Případovka z prostředí implementace projektu analýzy poslechovosti pro Český rozhlas.
- Specifické prostředí – ČRo má 10 stanic, 14 regionálních + několik webů + podcasty (Apple, Spotify, Bluburry, Podtrac) + mobilní appku rádia Junior + červené tlačítko na TV + YouTube videa. Dohromady okolo 2 milionů posluchačů.
- Různá omezení a problémy – velmi omezené statistiky YouTube (který má ale víc než 50 % všech poslechnutých pořadů), poslech autorádia se nezměří, část služeb vůbec nemá API apod.
Webová analytika v Českém rozhlase?
V @optimics navrhli Google Cloud architekturu:
streamování do BigQuery,
Cloud Endpoints (asi mysleli Cloud Functions,že?),
Cloud Storage,
Dataprep a
Data Studio.👍#datarestart #GoogleCloud pic.twitter.com/UgIiv7YgiD
— AppSatori ☁️ (@appsatori) March 5, 2020
- Na začátku intenzivní rozhovory uvnitř ČRo. Vyslechli potřeby koncových uživatelů a navrhli pro ně reporty.
- Technologicky řešení přes GA Web+App (focus na stream dat, není session based) / Firebase → Blaze → Dataprep → BigQuery → Data Studio.
- Do „červeného tlačítka“ HbbTV lze také implementovat GTM. Ale zpravidla si neudrží cookies.
Pavel Krejsa: Analýza dat a predikce chování zákazníků s pomocí Google Cloud
- Úvod do Google Cloud Platform – přečtěte si na toto téma náš článek Seznamte se s Google Cloud Platform.
- Machine Learning od Google je postavený na speciálním výkonném hardwaru k tomu určeném (TPU – Tensor Processing Unit).
Shrnutí úložišť a databázi v Google Cloudu#datarestart pic.twitter.com/03xx0UKc9N
— AppSatori ☁️ (@appsatori) March 5, 2020
- V BigQuery lze vytvořit i vyhodnotit predikční model a dále s ním pracovat v rámci standardního SQL dotazu (BigQuery ML) – příkazy jako CREATE MODEL, ML.EVALUATE nebo ML.PREDICT
- Praktický příklad – výpočet pravděpodobnosti dalšího nákupu zákazníka, ukázka nad anonymizovanými daty z Google Merchant Store.
- Rozdělíme dataset na tréninkový a evaluační.
- Naše práce = musíme určit, jaké proměnné mají vliv na pravděpodobnost nákupu.
Super přednáška od @pavelkrejsa z Google Cloud ČR o evoluci firemních IT systémů. Nyní jsme v době cloudové…#datarestart pic.twitter.com/ZwHzOcVxRG
— AppSatori ☁️ (@appsatori) March 5, 2020
- Pro začátek zkusíme jako vysvětlující proměnné celkový počet bounců a čas na stránce. Mají docela nevhodné rozložení první je skoro pořád nula, druhé má zase velký rozptyl. Ale i tak po 3 minutách učení máme vytrénovaný model, který dovede na 72 % předpovědět další nákup uživatele.
- Po přidání dalších vysvětlujících proměnných (zdroj návštěvy, země, typ zařízení, počet pageviews) se dostaneme na 91% přesnost.
- Co s tím dál – spouštět každý den, vytvořit si na predikované uživatele audienci a cílit na ně v Google Ads, oslovit ne napřímo e-mailem nebo personalizovaným sdělením na webu.
- Vedle takového rychlého předdefinovaného naučení můžu do BigQuery importovat i celý svůj hotový komplexní model z TensorFlow.
Jak se vám Data Restart líbil?
A co vy, byli jste na konferenci? Která přednáška nejvíc zaujala vás?
Nas drahy @etneteractivate’s CEO @JiriStepan rozjel #datarestart svou prezentaci o smrti 3rd party cookies a lehkou predikci vyvoje oboru. RIP pic.twitter.com/8KxYgexmir
— Hana Heulwen Kalivodová (@HeulwenCz) March 5, 2020