Jak automatizovat analýzu klíčových slov pomocí AI?

Automatizace pomocí umělé inteligence je tady! Pevně se zabydluje do nejrůznějších odvětví, včetně marketingu. Je tedy logické, že jako SEO specialisté nemůžeme stát stranou. V Taste jsme si tak rozpracovali několik projektů, jejichž úkolem je zefektivnit naší práci, a zároveň zkvalitnit naše výstupy.

A jedním z těchto projektů je i automatizace analýzy klíčových slov.

Co se hodí pro automatizaci?

Pod analýzou klíčových slov si mnozí SEO specialisté představí mnoho úkonů:

sběr dat
čištění dat
klasifikace/kategorizace klíčových slov
sběr doplňujících informací
návrh dalšího postupu
a další

Co tedy se tedy hodí automatizovat? My jsme se rozhodli pro automatizaci nejvíce časově náročných kroků, tedy:

čištění dat
klasifikace/kategorizace klíčových slov

PS: Jestli vás zajímá, jak konkrétně postupujeme při tvorbě analýzy klíčových slov? Můžete se podívat na náš vzorový výstup.

Jaké jsou hlavní výhody automatizace?

Hlavní výhodou automatizace analýzy klíčových slov je samozřejmě časová úspora. Ovšem další a neméně podstatnou výhodou je zvýšení kvality výstupu. Díky automatizaci totiž dokážeme ze vstupního datasetu vybrat pouze relevantní klíčová slova a dále je správně klasifikovat.

Co jsme vyzkoušeli bez úspěchu?

Na výzkum jsme věnovali více jak 100 hodin navrhování, testování a brainstormování. Celkem často jsme ovšem narazili a museli se vydat úplně jinou cestou. Níže se dozvíte, jaké cesty byly úspěšné či neúspěšné a proč.

1. ChatGPT a promptování pro klasifikaci klíčových slov

Jako první jsme chtěli vyzkoušet ChatGPT a klasické promptování. Ale ukázalo se, že tento způsob není vhodný z několika důvodů:

ChatGPT nedokáže pracovat s velkým datasetem.
Formát výstupu není vždy vhodný pro velké datasety (jedná se o formát chatu).
Stává se, že pro podobná klíčová slova navrhne jiné řešení, zkrátka si začne „vymýšlet“.

Prompt pro klasifikaci

Chybové hlášení při práci s velkým datasetem

2. ChatGPT API pro určení relevanci klíčových slov

Zkusili jsme druhý postup. Cílem toho kroku bylo zajistit označení relevantních klíčových slov. Postup ve zkratce byl následující:

Nacrawlování webu pomocí Screaming Frog a exportování meta titulků a H1 nadpisů.
Propojení ChatGPT s Google Sheets pomocí ChatGPT API.
Do sloupečku A byly zaneseny exportované meta titulky a H1 nadpisy.
Do sloupečku B byla vložena všechna klíčová slova, která jsme získali při sběru dat.
Do sloupečku C píšeme prompt ve stylu: „Porovnej slovo z buňky B2 s celým sloupečkem A a napiš, zda je slovo relevantní, či ne.“

Hlavní nevýhodou tohoto postupu je, že při velkém datasetu dochází k zasekávání – proto není toto řešení vhodné k velkým klíčovkám. Další nevýhodou, kterou můžete vidět na níže uvedeném screenshotu, je opět vymýšlení Chatu GPT. Slova, která jsou relevantní, označuje jako nerelevantní. I toto řešení nám tedy nedokázalo pomoci s automatizací analýzy klíčových slov.

ChatGPT API

3. Klasifikační script v Apps Script

I zde nám ChatGPT pomohl, ale spíše okrajově. Vytvořili jsme pomocí ChatGPT script pro klasifikaci. Tento script klasifikuje klíčová slova správně a efektivně pouze v případě, že vychází z vhodně zpracovaného klasifikačního schématu. Dané řešení se nerozhoduje na základě AI, ale čistě strojově – na základě dat, které mu na vstupu vložíme.

Nejedná se o špatné řešení. I tak se ale nedá využít ve 100 % případů a je spíše vhodné pro e-shopy. E-shopů je totiž v ČR dostatek a vždy se dá najít konkurenční e-shop, z kterého můžete nascraptovat data a vytvořit docela rychle klasifikační schéma. U analýzy klíčových slov u služeb to ale není vždy reálné řešení.

Klasifikační script

Řešení: vyladění AI pro své potřeby

Jak jsem uvedl, problém ChatGPT (ve formátu chatu) je to, že si často vymýšlí. Může se navíc stát, že se stejným zadáním dokáže na stejné či podobné klíčové slovo odpovědět jinak. Nedokáže udržet v paměti, jak odpovídal na předchozí dotaz. A to je přesně důvod, proč jsme se rozhodli pro fine-tuning.

A co je fine-tuning? Fine-tuning znamená doslova doladění či vylepšení. Jedná se tedy o vylepšení jazykového modelu umělé inteligence tak, aby nám odpovídal správně. Dodáme umělé inteligenci příklady správných odpovědí. Díky příkladům, které ji dodáme, dokáže námi „ohnutý“ model správně odpovídat podle našich představ a bez vymýšlení. My jsme zvolily konkrétně model Chat GPT 3.5 Turbo.

V praxi by příklad správné klasifikace pro učení jazykového modelu vypadal takto:

AI AKS

Jak probíhá fine-tuningování v praxi?

Pojďme podrobněji podívat, jak vypadá proces fine-tuningování:

1. Příprava dat

V první řadě je nutné si připravit co nejpodrobnější příklady, podle vzoru v tabulce výše. Tento krok je nejnáročnější a také nejdůležitější. Na správnosti vstupních dat záleží správnost výstupních dat. Data však neposíláme ve formátu tabulky, ale ve formátu JSON. Nejdříve si tedy připravíme data a poté je převedeme do formátu JSON.

2. Propojení/volání pomocí API

Proces fine-tuningování neprovádíme v samotném ChatGPT. Pro fine-tuning jsme využili programovací jazyk Python a knihovnu OpenAI, která je pro tyto případy přizpůsobena. Python využíváme jako komunikační zařízení se serverem OpenAI. Ke komunikaci se serverem OpenaAI je potřeba unikátní API klíč. API si snadno vygenerujete v administraci účtu OpenAI.

3. Odeslání dat a výsledek

Na server OpenAI poté odešleme už připravená data, na základě kterých budeme ChatGPT učit. Po zpracování dat můžeme náš model využít. Funguje to tak, že v Pythonu zadáme, aby se pracovalo s námi naučeným modelem. Když tedy pošleme seznam s klíčovými slovy a zažádáme o klasifikaci, tak klíčová slova budou klasifikována pomocí námi natrénovaného modelu.

Jaká je cena fine-tuningu?

Při využití API pro fine-tuning je cena individuální, a to v závislosti na počtu využitých tokenů.

1 token mapuje přibližně 4 znaky nebo přibližně 0,75 slova v běžném anglickém textu.

Tokeny ChatGPT

Například 620 znaků textu se rovnalo 151 tokenům, což vychází nákladově takto:

Trénování: 0,001208 $
Vstup dat: 0,000453 $
Výstup dat: 0,000906 $

Práce s plnou automatizací

Zdá se, že jsme našli správnou cestu! Nicméně pro její správnou a 100% funkční realizaci nám chybí data, přesněji řečeno velké množství dat. Čekají nás další desítky, možná i stovky hodin práce, učení a vývoje. V Tastu ale pevně věříme, že to přinese své výsledky:

časová úspora při práci na analýze klíčových slov
přesný výstupní dataset
- správně klasifikovaná klíčová slova
- určení search intent-u (záměr vyhledávání) u jednotlivých klíčových slov
- výběr pouze relevantních klíčových slov
- a mnoho dalšího

Pokud máte jakékoliv tipy ze své SEO praxe, budeme rádi, když se s námi podělíte nebo třeba odkážete na nějaký zajímavý článek, podcast nebo video.