Využíváte na pravidelné bázi Google Cloud, a obzvláště pak Google BigQuery? Pak jste na to stejně jako my v Tastu a dnešní článek je přesně pro vás. Ukážeme vám v něm možnosti, které nám Google nabízí pro využití AI a ML v Google BigQuery.
Dokonalý asistent Duet AI
Nejprve se pojďme podívat na Duet AI, který slouží jako takový osobní asistent doslova pro každého.
- Obchodníkovi pomůže s napsáním e-mailu potenciálnímu klientovi.
- Markeťákovi pomůže s vytvořením příspěvku na sociální sítě.
- Produkťákovi pomůže s analýzou feedbacku na produkty.
- Vývojáři pomůže s rychlejším psaním kódu.
- Dataři pomůže s vyhledáním trendů v datech.
Duet AI je natrénovaný na jazykovém modelu PaLM 2 stejně jako Bard. Pro nás v Tastu je nejzajímavější možností využít Duet AI v Google BigQuery, a to hned třemi způsoby:
- Auto-completion: Automaticky za vás doplňuje rozepsaný kód.
- Auto-generation: Automaticky za vás generuje kód na základě vašeho zadání.
- Explanation: Vysvětlí vám, co vybraná část kódu přesně dělá. Například se může hodit, když se chcete zorientovat v kódu, který psal někdo jiný.
Ve všech případech se bavíme samozřejmě o SQL kódu. Na praktickou ukázku všech třech využití se můžete podívat v následujícím GIFu.
Cena Duet AI pro Google Workspace se pohybuje kolem 30 EUR měsíčně za uživatele. Více o Duet AI si můžete přečíst třeba ve výborném článku How does Duet AI help us with Google Cloud? nebo v nápovědě Googlu Write queries with Duet AI assistance.
Možnosti s BigQuery ML
BigQuery ML je podle mého názoru ideální pro ty uživatele, kteří ovládají SQL, ale neumí nebo se nechtějí učit psát modely v jazycích, jako je Python či R.
Nejdůležitější SQL příkaz, který v tomto případě využijete, je „CREATE MODEL“. Pomocí něho vytvoříte model a pomocí příkazu „OPTIONS“ poté vložíte parametry tohoto modelu. Například o jaký model se jedná – zda jde o lineární regresi, logistickou regresi, K-means clustering, Principal component analysis, Time series atd. Pro logistickou regresi může query vypadat třeba takto:
V tomto případě se bavíme o takzvaně interně natrénovaných modelech, kdy trénování probíhá přímo v samotném BigQuery. Model ale můžete natrénovat i externě mimo BigQuery. Zvládnete to například ve Vertex AI nebo v některém z Google Remote Services, jako je Cloud NLP API, Cloud Vision API atd. Ty využijete v případě, že chcete třeba rozpoznávat obrázky nebo analyzovat texty.
Cena za 1 TiB (terabyte protrénovaných dat) je cca 375 USD (podle regionu). Více o BigQuery ML se můžete dozvědět třeba v praktickém článku A Step-by-Step Guide to Training a Machine Learning Model using BigQuery ML (BQML).
Podrobnější ukázku natrénování modelu v BigQuery na konkrétních datech si ukážeme zase někdy příště. Stay tuned!