Magazín ze světa digitálního marketingu
Pozadí vlevo Pozadí vpravo

AI Inside Out #83: Sora mění pravidla vizuální tvorby

Generovaná videa z rukou umělé inteligence nejsou žádnou novinkou. Ale s příchodem Sory se pravidla hry mění. V dnešním článku se podíváme, co tahle technologie skutečně dokáže – a proč by mohla zastínit vše, co tu bylo před ní.

AI Inside Out #83: Sora mění pravidla vizuální tvorby

Co je AI nástroj Sora?

Sora je nový model umělé inteligence od OpenAI. Dokáže převádět textové zadání do realisticky vypadajících videí. Stačí napsat například „kočka skáče po střechách v dešti“ a během chvilky získáte video, které vypadá jako z profesionální produkce.

Sora narozdíl od konkurence rozumí lépe prostoru, pohybu i fyzikálním zákonům. Takže výsledek působí přirozeně a věrohodně – a to vše bez kamery, filmového týmu nebo střihu.

Sora toho ale zvládá víc než jen převádění textu do videa. Umí také převádět statické obrázky do pohyblivých sekvencí nebo rozvíjet krátké klipy do delších příběhů. Jinými slovy: Sora funguje jako režisér, kameraman i střihač v jednom – a vše ovládáte jen slovy.

Model byl trénován nejen na statické obrázky, ale na pochopení dění v reálném čase. Dokáže tedy zachytit nuance pohybu, interakce mezi objekty a i jemné detaily jako odlesky, stíny nebo změnu počasí v čase.

Jak Soru začít používat?

Aktuálně je Sora dostupná pouze pro uživatele s předplatným ChatGPT Plus a Pro. Uživatelé s tarifem ChatGPT Plus mohou generovat videa do délky 10 sekund v rozlišení 720p. Uživatelé ChatGPT Pro získají možnost tvořit až 20sekundová videa ve Full HD kvalitě, a navíc si je stáhnout bez vodoznaku.

Sora podporuje také více formátů – širokoúhlý, vertikální, čtvercový. A co určitě potěší na rozdíl od ostatních video generátorů, že Sora není omezena kredity na generování.

Co všechno Sora dokáže?

U Sory platí, že hranicí je jen vaše představivost. A možná počet znaků v promptu. Díky schopnosti chápat prostor, světlo, pohyb i logiku scén dokáže Sora převést i ty nejbláznivější nápady do pohyblivých obrázků.

Chcete kočku, která vám připravuje espresso nebo ji vidět v podání keramického mistra, jak pomocí pacek točí na hrnčířském kruhu dílo, které by dalo zabrat i člověku? Nebo třeba seskok padákem s koněm v hlavní roli? Stačí to napsat.

Ne vždy ale funguje vše napoprvé. Někdy pomůže delší, detailní prompt. Jindy stačí jedna jednoduchá věta a výsledek je lepší, než byste čekali. Cesta ke kýženému výstupu je často o zkoušení, ladění a opakovaném generování. Určitě to chce vaši trpělivost – třeba až u desátého pokusu si řeknete, že tohle je Ono. A v tu chvíli zjistíte, že celá ta cesta za to stála.

Jak Soru využít v praxi?

Vytvářet videa, která překračují hranice představivosti, je zábavné, ale co praktické využití? Sora má obrovský potenciál i v běžné produkci, kde může usnadnit nebo zlevnit záběry, které by jinak vyžadovaly drahou techniku, speciální prostředí nebo časově náročné natáčení.

Představte si, že potřebujete detailní záběr otáčejícího se pomeranče, nebo makrozáběr, který se plynule přibližuje až na velmi blízký záběr rajčete. Nebo naopak detailní záběr lidského oka.

Takové scény obvykle vyžadují speciální objektivy, nasvícení a pečlivé plánování. Se Sorou to pro vás ale může být otázka pár minut bez jakékoliv techniky. Popíšete a necháte vygenerovat. A to vše ve stylu, který odpovídá vaší vizuální představě – realisticky, konzistentně a bez nutnosti kamerového štábu.

Kde jsou limity Sory?

Chaotická kontinuita

Delší videa mají tendenci ztrácet logiku. Postava, která držela hrnek, najednou drží telefon. Kůň, co běžel lesem, je o vteřinu později v kanceláři. Model má zatím problémy s udržením příběhové návaznosti, což může být výzva při snaze tvořit smysluplné narativní video.

Nespolehlivé výsledky

Někdy napíšete perfektní prompt… a Sora si stejně dělá, co chce. Výsledky nejsou konzistentní a i drobná změna v zadání může přinést úplně jiný výstup. Často tak musíte generovat opakovaně a ladit prompt stylem pokus–omyl.

Etické a společenské dopady

V neposlední řadě s příchodem Sory se neotevírají jen nové kreativní možnosti, ale i celá řada etických a společenských otázek. Když je možné během pár minut vygenerovat video, které vypadá jako skutečné, stává se vizuální důkaz najednou mnohem méně spolehlivý.

Může to znamenat zásadní výzvy pro média, politiku nebo justici – protože jak rozeznat, co je reálné a co vzniklo umělou inteligencí? Další otázkou je dopad na pracovní trh – profese jako animátor, kameraman nebo střihač mohou pocítit tlak automatizace, ačkoliv zároveň vznikají i nové role, třeba AI režisér nebo „prompt designer“.

V neposlední řadě se nabízí téma autorských práv – kdo vlastní výsledné video? Tvůrce promptu, vývojář modelu, nebo někdo jiný? Technologický skok, který Sora přináší, zkrátka není jen o inovaci, ale i o spoustě otázek.

Sora umí i fotografie a obrázky

Sora ale není jen nástroj na generování videí. Donedávna jsme byli zvyklí vytvářet obrázky převážně přes Midjourney nebo podobné nástroje. Jenže s příchodem Sory se situace mění – a u mě osobně to znamenalo i konec používání Midjourney. Všechny potřebné vizuály teď generuji výhradně přes Soru.

Líbí se mi, že dokáže zapracovávat text do vizuálu. Předělávat fotky na ilustrace. A taky že dokáže dělat realističtější obrazy, než jsem kde doposud viděl. Vyžaduje to ale dobré prompty. 

Efekt realističnosti nevzniká jen díky tomu, co je na obrázku. Ale i díky tomu, jak to vypadá. Právě drobné vizuální prvky jako rozmazání pohybem (motion blur), odlesky objektivu (lens flare), jemný šum (noise), ostrý záblesk blesku nebo drobné nedokonalosti na objektu i ve scéně dodávají výstupu uvěřitelný charakter.

V reálném světě totiž není nic dokonale čisté a sterilní – kamera má své limity, světlo občas přepálí scénu a pohyb zanechá stopy. A právě tyto „chyby“ jsou paradoxně klíčem k tomu, aby AI výstup působil jako autentická fotografie, ne jako generovaný obrázek.

žena, která leze po skále

Záznam realistického výstupu pomocí přidání ostrého blesku, širokého objektivu a šumu.

Na tomto vygenerovaném výstupu je dobře vidět, jak moc může realistický dojem ovlivnit správně zvolený prompt. Zadáním ostrého blesku, širokoúhlého objektivu a jemného šumu získala scéna přirozenou nedokonalost, která působí jako z reálné fotografie. Právě tyto drobnosti – přepaly, zkreslení či zrnitost – jsou tím, co dává obrazu autenticitu.

Ale vyvstává otázka: dokáže AI vytvořit ještě věrohodnější výstup?

Postarší pán, který si dělá Selfie v praze

Roztřesené selfie staršího muže, který je na procházce Prahy.

Kočka, která si dělá selfie v Africké savaně

Selfie od kočky, která se fotografuje se lvem.

Ano, i tyhle snímky jsou generované pomocí Sory. Stačí do promptu přidat, že mají působit jako focené iPhonem, přidat lehké rozmazání nebo šum – a rázem to vypadá jako běžná nedokonalost, která by klidně mohla vzniknout v reálném světě.

Sora nabízí budoucnost už teď

Sora ukazuje, že budoucnost vizuální tvorby už není za rohem – ona už tu prostě je. A i když má stále své limity, jako občasné nelogičnosti nebo zvláštní detaily, nabízí funkce, které dokážou ušetřit čas, peníze i produkční nervy. Pro tvůrce to může být silný parťák – ať už chcete rychle vizualizovat nápad, nahradit složité natáčení, nebo si prostě jen pohrát s tím, co všechno AI zvládne.

Ať už Soru vnímáte jako nástroj, hrozbu, nebo fascinující hračku, jedno je jisté: ignorovat AI nástroje na tvorbu obrázků a videí už není možné. Kdo se naučí s ní pracovat včas, bude mít náskok.

Tipy na závěr

  • Skvělým způsobem, jak se rychle posunout, je sledovat feed Sory a dívat se, co tvoří ostatní uživatelé. Nejenže tak získáte přehled o možnostech nástroje, ale často narazíte na prompty, které můžete s drobnou úpravou využít jako základ pro vlastní tvorbu. Naše mysl si teprve zvyká na to, co všechno je pomocí AI možné – a právě tahle inspirace může být nečekaně cenná.
  • Rozhodně doporučuji zapojit ChatGPT při tvorbě promptů. Pokud máte v hlavě konkrétní představu, popište ji v několika větách a nechte ChatGPT, aby z toho vytvořil promyšlený a pro Soru „čitelný“ prompt. Často přidá detaily, které by vás třeba ani nenapadly, a výsledek pak působí uvěřitelněji nebo vizuálně bohatěji.
  • A hlavně nebojte se zkoušet a chybovat. První výstup často nebude dokonalý, ale každý další vás posune blíž k tomu, co máte v hlavě.
Sdílejte článek

Související články