Když v současnosti dorazíte téměř na jakoukoliv konferenci, je velmi pravděpodobné, že se setkáte s moderními „buzzwordy“ jako jsou Machine Learning (ML), AI, Data Science, IoT, apod. Ačkoliv o nich mluví skoro každý, častokrát se ve skutečnosti ukáže, že lidé daným výrazům tak úplně nerozumí, neumí je od sebe odlišit, ale používají je, protože to je in. Abyste se v takové situaci na příští konferenci neocitli, připravili jsme pro vás malý slovník nejčastějších buzzwordů. Mimo to nabyté znalosti oceníte i v našem dalším článku, který se bude týkat technické stránky Business Intelligence, a pro který bude znalost těchto pojmů velice užitečná.
Data science
Myšlenka/definice: Soubor metodologií a přístupů k datům, kombinuje poznatky ze statistiky a informatiky, většinou za účelem vytěžení byznysové hodnoty. Využití statistiky v byznysovém prostředí.
Fáze v diagramu: Všechny. Data science se využívá v každé fázi, a správný ,,datový vědec” ovládá nejen úpravu dat a modelování, ale hlavně koncepčně rozumí tomu, jak s daty pracovat, jak pomocí nich rozhodovat a jak je interpretovat neodborníkům.
Příklad: viz Business Intelligence nebo Advanced Analytics
Business Intelligence
Myšlenka/definice: Jako Business Intelligence se často označují součásti BI sloužící k vizualizaci, se kterými přímo pracují koneční uživatelé, tedy například Power BI, Tableau, Looker. BI ale zahrnuje i proces získávání, čistění a validování dat, jako i skladování dat a modelování. Na pokročilejší modelování, například predikční modely, se používá výraz Advanced Analytics. Některé BI nástroje také obsahují možnosti pro extrakci a modelování dat, obdoba Extract a Transform z procesu ETL.
Fáze: BI široko zastřešuje celý proces popsaný v diagramu, někdy konkrétní technologie a metodologie pro technickou práci s daty.
Příklad: Chceme udělat na skladě místo pro nové produkty. Potřebujeme tedy zjistit, které nynější produkty zabírají nejvíc místa oproti své ziskovosti. Proto propojíme data z nákladů a prodejů a skladů, abychom zjistili marži, obrat inventáře a zároveň kolik prostoru nám produkty zabírají. Potom se rozhodneme, které produkty budou mít v budoucnosti méně prostoru, čímž vytvoříme místo na nové produkty.
Advanced Analytics
Advanced Analytics se dá pokládat za součást BI, jedná se o využití pokročilých machine-learningových metod za účelem přesnější analýzy.
Myšlenka: Chtěl bych předpovídat prodeje na jednotlivých prodejnách na několik týdnů dopředu. Použiji machine-learningový model, který dokáže vzít v úvahu desítky dalších faktorů.
Fáze: Modelování dat
Příklad: rozvineme poslední příklad (BI). Namísto deskriptivní analýzy vytvořím model, který bude dynamicky předpovídat prodeje na následující období, a podle nich zjišťovat, jaké množství produktů třeba v nejbližší době doobjednat pro nejvyšší zisk.
IoT – Internet of things, internet věcí.
Myšlenka: Přístroje dokáží spolu komunikovat přes internet bez zbytečného zásahu člověka.
Fáze: Sběr dat
Příklad dnes: Senzory a čidla ve výtazích sledují opotřebování, a proto je možné plánovat údržbu před tím, než se výtah porouchá.
Příklad do budoucna: Senzory volných parkovacích míst budou hlásit městskému parkovacímu monitoru svou obsazenost, řidiči, jako i samořídící auta budou dopředu vědět, kde mají zaparkovat.
Fáze: Rozhodnutí
K internet of things patří i další část, a to komunikace směrem k zařízení připojenému k internetu.
Příklad dnes: Vracím se z dovolené, a z telefonu zapnu topení, abych přišel do vyhřátého bytu.
Příklad do budoucna: Topení se vypíná a zapíná úplně autonomně na základe dat z mojí polohy, vnější a vnitřní teploty, času.
Big Data
Myšlenka: Data, na která nestačí tradiční technologie ukládání a analýzy dat.
Fáze 1: Sběr dat
Příklad dnes: Každou vteřinu jsou na sociální sítě nahrané tisíce fotek, uživatelé očekávají, že budou hned dostupné pro ně a všechny jejich přátele.
Příklad do budoucna: Obchod sleduje pohyb zákazníků po prodejně, data anonymizuje v reálném čase, aby je mohl ukládat do datového skladu.
Fáze 2: Modelování a vizualizace dat
Příklad dnes: Všechny fotky nahrané na Facebook projde algoritmus na automatizované označení přátel. Sami uživatelé potom “učí” stroj tím, že hodnotí jeho práci.
Příklad do budoucna: Zákazníci jsou segmentovaní podle pohybu po obchodě. Jsou vytvořené mapy prodejny, a identifikované nejhodnotnější regály.
ETL ( Extract, Transform, Load)
Fáze: Stahování, čištění, modelování a ukládání dat
Myšlenka: Terminus technicus který popisuje všechno, co se s daty děje od doby, kdy jsou posbíraná, až po jejich využití či úschovu.
Příklad Extract: Stáhneme si nákladová data z reklamních systémů (Facebook, Sklik, Google Ads) a údaje o chování návštěvníků stránek (Google Analytics).
Příklad Transform: Napojíme jednotlivé náklady z reklamních systémů na návštěvy naší stránky a očistíme data o návštěvnost robotů.
Příklad Load: Data nahrajeme do databáze.
AI/Machine Learning
Fáze: Čistění a modelování dat
Myšlenka: Když se v souvislostmi s daty bavíme o AI, tedy umělé inteligenci, máme na mysli machine learning. Tedy případ, kdy se stroj dokáže na základě zkušenosti zdokonalovat v určité úloze.
Příklad: Samořídící auto sbírá zkušenosti tím, že jezdí. Podle toho, které jeho kroky vedou k plynulé a efektivní jízdě sbírá zkušenosti, které dále využívá pro vylepšování svých schopností.
Reporting
Fáze: Vizualizace, rozhodování
Myšlenka: Ani ta nejlepší data a nejlepší modely nic nezmohou, když na ně nejsou napojené rozhodovací procesy. Jakmile je za rozhodnutí zodpovědný člověk, je potřeba mu výsledky podat v pochopitelné podobě.
Příklad: Systém preventivní údržby výtahů funguje možná dobře, možná ne. Je potřebné managementu poskytnout údaje o nákladech a úsporách porovnané s regiony, kde systém zavedený není, popřípadě s historickými daty.
Cloud
Fáze: Technická část (sběr, čištění, modelování, vizualizace, ukládání dat)
Myšlenka: Namísto toho, aby si každá firma kupovala vlastní hardware, bude jedna firma pronajímat svůj hardware ostatním společnostem, které ho budou využívat podle potřeby. Nekupují si tedy počítač jako výrobek, ale přímo výpočetní sílu a úložný prostor jako službu.
Příklad: Na predikční model potřebujeme velkou výpočetní sílu. Místo toho, abych si koupil výkonný počítač za několik desítek tisíc korun, pronajmu si na chvíli superpočítač od Google, na kterém proběhnou všechny náročné výpočty za pár minut a pár korun.
Data warehouse (datový sklad)
Fáze: Ukládání dat
Myšlenka: Data warehouse je doslova skladiště dat. Data, ke kterým není potřeba mít vždy rychlý přístup, mohou být uskladněná právě zde.
Příklad: Záběry z bezpečnostních kamer využíváme jen v ojedinělých případech, proto mohou být ukládané do Data warehouse.
Data-driven rozhodování
Fáze: Rozhodování
Myšlenka: Nejčastěji se výraz data-driven využívá ve spojitosti s rozhodováním pomocí dat. Je tu jakési spektrum, kde na jedné straně rozhodnutí můžeme dělat úplně intuitivně a na druhé čistě na základě dat. Lidské schopnosti jsou kdesi uprostřed, využíváme různá shrnutí a grafy, abychom se pomocí nich lépe rozhodli, ale téměř vždy do procesu zapojujeme i expertní znalosti, abychom věděli, co graf vyjadřuje a jak zapadá do našeho rozhodování. Rozhodovat se čistě na základě dat potom dokáže umělá inteligence, která nepotřebuje data agregovat, ale dokáže posoudit každou informaci zvlášť. Když tato rozhodnutí dělá počítač čistě na základě dat, mluvíme o AI-driven rozhodování.
Příklad: Marketingový ředitel potřebuje omezit nejméně přínosné reklamy. Namísto využití pouze své intuice zhodnotí přínosy reklamy podle dat o návštěvnosti či tržbách za jednotlivé reklamy.