Google Data Studio je nástroj umožňující zobrazit data v jednoduché, dostupné a znovu využitelné formě. Dneska se podíváme na funkci, která umožňuje spojit různé zdroje dat. Angličtina má pro tuto funkci slovní spojení data blending, v češtině tedy smíšení dat.
Co vlastně dělá data blending?
Funkce, kterou si představíme, umožňuje obohatit jeden zdroj dat o metriky a dimenze z jiného zdroje. Toto spojení se děje na základě společné dimenze. Například na základě data:
Pro jednorázové spojení dat z různých zdrojů si stačí stáhnout data z obou zdrojů a spojit si je třeba v Excelu. Toto řešení však není ideální, pokud data potřebujete spojovat třeba pokaždé na konci měsíce. Právě v tom pomáhá data blending. Nastavení není nijak složité, přidáme oba zdroje dat do datastudia a následně můžeme jít dvěma cestami. První je, že vytvoříme dva různé grafy, zvolíme oba a klikneme na možnost Blend data jako na obrázku níže:
Nebo při vytváření nového grafu místo zvolení zdroje dat klikneme na tlačítko BLEND DATA:
Můžeme takto spojit až 5 různých zdrojů dat. Jediné omezení je, že všechny musí mít aspoň jednu společnou dimenzi, na základě které se data spojí. K tomu si pak můžeme přidat několik dimenzí a metrik, které chceme vidět. Konkrétní nastavení může vypadat například následovně:
Pozor, záleží na pořadí přidání
V dokumentaci data blendingu se píše, že používá left outer join. To by znamenalo, že se vezmou hodnoty z prvního datového zdroje a obohatí se o data z druhého datového zdroje. Ale pozor – po takovémto spojení můžete mít více nebo naopak méně záznamů, než jste měli na začátku.
Nejdřív si ukážeme, jak se může vytvořit více záznamů:
Párujeme podle dimenze d1 a jak můžete vidět, do spojených dat se propsaly všechny kombinace dimenzí d2 a d3. Proto je potřeba dát si pozor, jestli náhodou nebudou dodatečné dimenze zkreslovat data tím, že se budou tvořit jejich kombinace.
Případ, kdy se nám ukáže méně dat, je trochu specifičtější:
Stejně jako v předešlé ukázce se páruje na základě dimenze d1. Teď se ale objevují hodnoty null, jedná se o prázdnou hodnotu, respektive nevyplněné políčko tabulky. Pojďme se detailněji podívat, co se stalo. Pokud chybí hodnota někde v prvním datovém zdroji v dimenzi, dle které párujeme data, daný záznam se do výsledku propíše, ale nebude obohacený o žádné data. Pokud hodnota v párované dimenzi neexistuje v druhém nebo dalším datovém zdroji, tak je při párování ignorována.
Pokud si to ukážeme množinově, tak při párování tří zdrojů si data blending můžeme představit následovně:
V podstatě by se ve spojených datech měly zobrazit záznamy z množiny A obohacené o metriky a dimenze z množiny B a C. Ale to taky není úplně pravda:
Jak můžeme vidět, hodnota e se napárovala správně přes všechny zdroje. Ale co hodnoty a a b v dimenzi d1? Jsou to hodnoty z prvního datového zdroje. V druhém zdroji ale chybí hodnota a. Tím pádem se s druhým zdrojem napáruje pouze hodnota b, což si můžeme zkontrolovat u metriky m2 ve spojených datech. V třetím kroku se nenapáruje nic, protože hodnoty c a d se nenachází v datovém zdroji 1. Ve čtvrtém kroku bychom očekávali, že by se napárovala hodnota a, ale není tomu tak, pravděpodobně z důvodu, že se jí nepodařilo napárovat v jednom z předešlých zdrojů dat.
Možné využití
Tuto funkci můžete využít například pro spojení dat z Google Ads a Google Search Console. Tím můžete získat přehled o celkovém výkonu ve výsledcích v Googlu na jednotlivá klíčová slova. Pokud máte více domén, na jejichž návštěvnost byste se chtěli podívat, můžete si spojit různé Google Analytics služby a získáte souhrnná data. Jestliže váš web slouží pro získávání leadů a transakce se uzavírají až mimo něj, můžete si spojit data z CRM s těmi z Google Analytics, abyste zjistili reálný výkon zdrojů návštěvnosti. Jediné, co budete muset zajistit, je, abyste je měli podle čeho párovat.
Dávajte si ale pozor, protože je pravděpodobné, že když zdroje spojíte v různých pořadích, dostanete různé výsledky. Například u spojení Google Ads a Google Search Console podle klíčových slov to tak určitě bude, protože je vcelku časté, že na některé výrazy cílíte reklamu, ale nezobrazujete je organicky a naopak.
Závěr
Data blending je vcelku silný nástroj, kterým dokážeme přidat trochu kontextu do dat. Ale je nutné si dát pozor, protože má hodně specifické chování, ne vždy zobrazí to, co si myslíme, že by zobrazovat měl.