Pre niekoho to môže znieť ako nočná mora, pre iného je to ďalšia úroveň zábavy. Nový generátor videí Sora 2 od OpenAI vie využiť reálnych ľudí, rozpohybovať ich, ozvučiť ich hlasom a vložiť do 10-sekundovej virtuálnej scény, ktorú vytvorí na základe textového promptu.
Tieto avatary spoločnosť nazýva cameos a na ich vloženie do systému sa musí používateľ najskôr „naskenovať“ pomocou mobilného telefónu. Podobný systém vytvorenia avatara poznáme napríklad z okuliarov Vision Pro od spoločnosti Apple.
„Vďaka funkcii cameos sa môžete preniesť priamo do akejkoľvek scény vytvorenej Sorou s pozoruhodnou vernosťou, a to po krátkom jednorazovom nahraní videa a zvuku v aplikácii, ktorá slúži na overenie vašej identity a zachytenie vašej podoby,“ vysvetľujú ľudia z OpenAI na blogu.
Zástupcovia OpenAI uviedli, že aplikácia obsahuje opatrenia, ktoré zabraňujú vytváraniu videí s verejne známymi osobnosťami alebo ostatnými používateľmi bez ich súhlasu. Má k tomu viesť už samotné nahrávanie obrazu avatara do systému, kedy aplikácia vyžaduje, aby používateľ pohyboval hlavou do rôznych smerov a povedal náhodnú postupnosť čísel. Používatelia tiež budú mať možnosť vidieť návrhy videí, v ktorých sa ich podoba objavuje.
Nová sociálna sieť
„Minulý týždeň sme aplikáciu interne spustili pre všetkých zamestnancov OpenAI. Od našich kolegov sme už počuli, že vďaka tejto funkcii si v spoločnosti nachádzajú nových priateľov. Myslíme si, že sociálna aplikácia postavená na tejto funkcii "cameos" je najlepší spôsob, ako zažiť čaro Sora 2,“ popisujú ďalej.
Práve novo spustená sociálna sieť na zdieľanie videí, ktorá je zatiaľ prístupná iba na pozvánky a dostupná len na iOS v Spojených štátoch, môže byť ďalším krokom spoločnosti, ktorý jej pomôže získať potrebné dáta pre vývoj tohto nástroja. Je priamo navrhnutá na vytváranie a zdieľanie videí generovaných umelou inteligenciou z textového zadania.
Napojenie AI generátora videí na sociálnu sieť pritom nie je nič nové. Už pri uvedení systému Veo 2 od Googlu bolo možné jeho schopnosti využiť v Youtube Shorts.
Realistickejšia fyzika
Vráťme sa ale k novinke od OpenAI. Nový generátor videí Sora 2 vylepšuje pochopenie celej scény a fyziky, ktorá sa v nej odohráva. „Náš najnovší model generovania videa je fyzicky presnejší, realistickejší a ovládateľnejší ako predchádzajúce systémy. Obsahuje aj synchronizované zvukové efekty a dialógy,“ popisuje hlavné zmeny OpenAI.
Sora 2 tak má dokázať veci, ktoré boli pre predchádzajúce modely ťažké, až nemožné. OpenAI uvádza ako príklad gymnastické zostavy, saltá vzad na paddleboarde, ktoré presne modelujú dynamiku vztlaku a pružnosti.
„Predchádzajúce video modely sú príliš optimistické - menia objekty a deformujú realitu, aby úspešne vykonali textový príkaz. Napríklad ak basketbalista minie kôš, lopta sa môže spontánne teleportovať do koša. V modeli Sora 2 sa lopta odrazí od dosky, ak basketbalista minie kôš,“ upozorňujú tvorcovia modelu. Pochvaľujú si tak, že model získal dôležitú schopnosť modelovať nielen úspechy, ale aj neúspechy.
Problém s autorskými právami
Aj Sora 2 umožňuje používateľom vytvárať a zdieľať na sociálnych sieťach videá, ktoré môžu byť vytvorené z autorsky chráneného obsahu. Majitelia práv, napríklad televízne a filmové štúdiá, sa musia aktívne odhlásiť, ak nechcú, aby ich diela boli použité, uviedli predstavitelia spoločnosti. Tento krok, ktorý nadväzuje na predchádzajúce zásady spoločnosti ohľadom generovania obrázkov, pravdepodobne podľa ČTK vyvolá kritiku v Hollywoode.
Spoločnosť OpenAI v posledných týždňoch rokovala s rôznymi držiteľmi autorských práv o novej politike aplikácie. Podľa zdrojov sa aspoň jedno veľké štúdio, Disney, už rozhodlo, že jeho materiál sa vo videách aplikácie Sora objavovať nebude.
Na začiatku tohto roka OpenAI tiež apelovala na administratívu Donalda Trumpa, aby oficiálne uznala, že keď sa AI učí z materiálov, ktoré sú chránené autorským právom (filmy, seriály a knihy), nejde tým automaticky o porušenie autorských práv. Považuje sa to totiž podľa OpenAI za takzvané fair use, teda zákonné dovolené použitie na účely výskumu, vzdelávania alebo vývoja technológie.
