V únoru OpenAI představila velmi očekávanou Soru, která podnítila nadšení mezi nadšenci po celém světě. Nyní toto očekávání vyvrcholilo uvedením společnosti Sora na trh jako součást nedávné série vydání produktů OpenAI, která začala předplatným ChatGPT Pro a uvedením modelu o1.
Model převodu textu na video upoutal celosvětovou pozornost během své první ukázky, ale dříve byl omezen na malou skupinu umělců, filmařů a testerů. Se spuštěním Sora mohou nyní uživatelé vytvářet videa poskytováním textových výzev spolu s obrázky a dalšími videi. Tento inovativní model dokáže generovat složité scény s více postavami a různými pohyby. Podle OpenAI Sora nejen interpretuje výzvy uživatelů, ale také chápe, jak tyto prvky interagují v reálném světě.
V současné době je video model přístupný předplatitelům ChatGPT (jak Plus, tak Pro) se sídlem v USA a různých dalších regionech. Přístup je však ve velké části Evropy a Spojeného království omezen, pravděpodobně kvůli přísnějším předpisům o digitálním soukromí v těchto oblastech, na jejichž orientaci se OpenAI snaží.
Předplatitelé ChatGPT Plus s cenou 20 $ měsíčně mohou vytvořit až 50 prioritních videí (ve výši 1 000 kreditů), z nichž každé trvá až 5 sekund v maximálním rozlišení 720p.
Naopak předplatitelé ChatGPT Pro za 200 $ měsíčně těží z možnosti produkovat až 500 prioritních videí (10 000 kreditů), neomezený počet uvolněných videí, prodloužené generování videa až na 20 sekund a možnost stahovat videa bez vodoznaku. OpenAI také plánuje zavést různé cenové struktury, které budou v budoucnu uspokojovat různé potřeby uživatelů.
Sora je nabitá několika vzrušujícími funkcemi, včetně funkce Remix pro změnu konkrétních segmentů videa pomocí textových výzev, možnosti Recut pro rozšíření izolovaných scén, různých předvoleb stylů a nástrojů pro snadné smyčkování a míchání videí. Rozhraní obsahuje funkci „Storyboard“, kde uživatelé mohou vytvořit sekvenci videí prostřednictvím řady textových výzev.
Jak se očekávalo, OpenAI postupuje s tímto video modelem opatrně. Všechna vygenerovaná videa budou obsahovat vodoznak (který mohou odběratelé Pro odstranit) spolu s metadaty C2PA, která pomohou vysledovat původ obsahu generovaného Sorou. Společnost také vyvinula interní vyhledávací nástroj, který analyzuje technické vlastnosti video výstupů pro ověření jejich původu. Tento krok má za cíl bojovat proti dezinformacím, podvodům a deepfake.
Než budou uživatelé moci nahrát jakékoli obrázky nebo videa, musí souhlasit s tím, že budou vlastnit práva k těmto materiálům, a potvrdit, že na nich nejsou zobrazeni žádní jednotlivci mladší 18 let, ani žádný násilný nebo explicitní obsah. Obecné nahrávání s lidmi bude při spuštění omezeno, přičemž budoucí rozšíření závisí na zdokonalení strategií zmírňování hluboce falešných zpráv od OpenAI.
Sora je nezávisle přístupná prostřednictvím nové platformy na adrese sora.com. Uživatelé mohou zadávat výzvy ze spodní části obrazovky a upravovat různá nastavení, jako jsou přednastavené styly, trvání, rozlišení, poměr stran, počet variací a další před generováním videa. Rozhraní také ukazuje, kolik kreditů bude spotřebováno na základě těchto parametrů. Ve výchozím nastavení Sora generuje čtyři různé varianty každé výzvy.

Kvůli obrovské poptávce však byly registrace nových účtů pro Sora pozastaveny. Sam Altman uvedl, že probíhají snahy o řešení této situace.
Výrazně jsme podcenili poptávku po Soře; bude chvíli trvat, než poskytneme přístup všem. Pracujeme tak rychle, jak je to možné, abychom to vyřešili!
— Sam Altman (@sama) 10. prosince 2024
Pokud zjistíte, že nemáte přístup k Sora nebo nejste platícím odběratelem, stále můžete procházet zdroj videí generovaných jinými uživateli.
Zatímco video model vykazuje některá současná omezení, včetně obtíží při vytváření realistických videí a problémů s zobrazováním složitých akcí v delších formátech, bude zajímavé sledovat, jak se vyvíjí a ovlivňuje budoucí krajinu video produkce a spotřeby.
Napsat komentář ▼