Letošní Data Restart byl nabitý přednáškami z různých odvětví datové analytiky. Jedna linka se však nesla celým dnem. Analytika pokulhávající byznys nespasí. To hlavní ze tří nejzásadnějších přednášek jsme pro vás sepsali.
Data – dobrý sluha, zlý pán
Data Restart je konference o datech. Takže o tom, kde všude mohou data pomoci, proč by se měla sbírat, jak by se měla vyhodnocovat, a jak data spasí celý svět. Jan Tichý však hned na úvod vystoupil s přednáškou odsuzující posedlost daty. Mluvil o tom, jak se čím dál častěji setkáváme s „data-overdriven company“, kde se vše přizpůsobuje a ohýbá pro datové potřeby. Za zásadní chybu považuje, když firmy pro okamžitý výkonnostní zisk používají „chladný kalkul“ založený čistě na datech.
Naopak firmám doporučil se dívat za hranu měřitelných a dohledatelných dat. Investujte do dlouhodobějších aktivit týkajících se brandu a rozvoje. Jako jeden z nešvarů, které vzniknou při prostoupení dat celou firmou, uvedl považování dat za náhradu přemýšlení aneb „mám data, udělám, co mi data říkají, hlavu není třeba používat“. Často proto i my jako agentura klientům vysvětlujeme, že data se musí brát s rezervou a měla by být používána jakožto podpůrný prostředek při rozhodování, ale znalost kontextu oněch dat byla, je a vždy bude naprosto stěžejní.
Pojišťovací podvodníci vs. Neuronové sítě
Co by to bylo za konferenci o datech, kdyby se alespoň jedna přednáška nevěnovala boomu neuronových sítí? Neuronové sítě se čím dál trvaleji usazují v našich životech. Překládají jazyky, vyhlazují obraz v TV, začínají řídit auta atd. V případě Data Restartu se o využití této trendující metody zpracování dat rozpovídal Boril Šopov a to ve spojitosti s pojišťovnictvím.
Vysoká očekávání měl s touto přednáškou spojená jistě každý. Pojišťovny se dostanou k obrovskému množství dat. Jak je využít pro svůj prospěch? Boril se věnoval hned několika pojišťovacím produktům a využití „neuronek“ v jejich běžné agendě. Například pro detekci podvodů v oblasti pojištění motorových vozidel. Neuronová síť dokáže porovnat fotografie vozu pořízené při sjednání pojištění, kdy bylo vozidlo nepoškozené, s fotografiemi pořízenými jako důkaz pojistné události. Síť je schopná zjistit značku, typ, barvu, modelový rok a další vlastnosti vozidla. Dále určí, jaké části vozu jsou jak poškozené. Zde to ale nekončí! Zásadní přínos je v tom, že neuronová síť dokáže porovnat promáčklé dveře Škody Octavia se stovkami nebo tisíci promáčklými dveřmi stejného typu, jejichž fotografie pojišťovna (nebo další spolupracující pojišťovny) historicky mají. Častou praktikou podvodníků je totiž namontování poškozených dveří na jiné vozidlo a následné předstírání nově vzniklé škody.
Systém neuronových sítí dokáže tyto podvody odhalovat a v případě pochybností upozorní likvidátora. Celý proces této automatizace ušetří pojišťovně značné náklady, jelikož ve většině případů nemusí do případu vstupovat manuální kontrola likvidátorem. Pro srovnání: likvidátor zvládne vyřídit jeden případ za 30 minut, kdežto neuronová síť za stejnou dobu vyhodnotí 57 600 případů. Stejný princip lze aplikovat i v případě úrazového pojištění, kdy síť vyhodnotí pravost lékařské zprávy.
Co dělat a nedělat s daty
Zajímavou úvahovou přednášku nad celým datovým odvětvím a jeho budoucností měl Giuliano Giannetti. Téma uvedl pár čísly z oboru:
- 209 – 338 biliónů Kč je odhadovaný přínos pokročilé analytiky do světového HDP v příštích 5 letech;
- 250 000 Data Scientists (datových vědců) bude v příštích letech chybět na trhu práce v USA;
- 8 % společností používá „Big Data“;
- pouze 3 % firem používá social data.
Mnohé firmy řešící přechod na tzv. „Data driven company“ by měla zajímat zmíněná studie od společnosti McKinsey&Company, která rozdělila datové a analytické use cases do diagramu podle dvou faktorů: jak zásadní mají přínos a jak snadno/obtížně je dosažitelná jejich implementace. Pro zajímavost uvádíme, že jako nejsnáze proveditelné a zároveň vysoce přínosné z pohledu peněz jsou optimalizace marketingových spendů.
Stejně jako Honza Tichý, je i Giuliano Giannetti hluboce přesvědčen o tom, že ani firmy často samy nevědí, co je důležité pro jejich business a že fakta a čísla, která by je měla zajímat, jsou ve skutečnosti naprosto základní a jednoduchá. S Honzou Tichým oba shodně apelovali také na to, abychom nedělali tu častou chybu, kdy se zaměřujeme na data, která máme, nikoliv na data, která potřebujeme. Jedním z dalších zásadních apelů, které Giuliano vznesl vůči lidem zabývajícími se daty, bylo, ať se neustále ptají PROČ. S tímto apelem se vzhledem k vlastním zkušenostem mohu jednoznačně ztotožnit. Nesčetněkrát se mi totiž stalo, že klient nebo kolega si přáli udělat konkrétní věc, ke které vedla náročná cesta s nákladným řešením, přičemž reálně po otázce PROČ to chtějí, se zjistilo, že řešení může být úplně jiné a mnohem jednodušší. Takže – ptejte se PROČ 😊.
Další velmi zajímavou přednášku měl Honza Kadleček, který velmi trefně vystihl nejčastější neduhy, se kterými se setkává v Google Analytics. Toto téma ještě sám Honza více rozvede v samostatném článku na Digichefu. Pokud byste se při čekání na článek snad začali nudit, můžete si projít veškeré přednášky, které na konferenci zazněly. A zároveň si do diáře zaznačit, že příští rok ve stejnou dobu se bude konat další Data Restart. Ale nebojte, my se připomeneme. Data o vás máme. 😊