През февруари OpenAI представи дългоочакваната Sora, разпалвайки вълнение сред ентусиастите по целия свят. Сега това очакване достигна кулминация с пускането на Sora като част от скорошната серия от издания на продукти на OpenAI, които започнаха с абонамент за ChatGPT Pro и пускането на модела o1.
Моделът текст към видео привлече световното внимание по време на първоначалната си предварителна версия, но преди това беше ограничен до малка група художници, режисьори и тестери. С пускането на пазара на Sora потребителите вече могат да създават видеоклипове, като предоставят текстови подкани заедно с изображения и допълнителни видеоклипове. Този иновативен модел може да генерира сложни сцени с множество герои и различни движения. Според OpenAI, Sora не само интерпретира подканите на потребителите, но също така разбира как тези елементи си взаимодействат в реалния свят.
В момента видеомоделът е достъпен за абонати на ChatGPT (както Plus, така и Pro), базирани в САЩ и различни други региони. Достъпът обаче е ограничен в голяма част от Европа и Обединеното кралство, вероятно поради по-строгите разпоредби за дигитална поверителност в тези области, които OpenAI работи за навигация.
Абонатите на ChatGPT Plus, на цена от $20/месец, имат право да създават до 50 приоритетни видеоклипа (възлизащи на 1000 кредита), всеки с продължителност до 5 секунди при максимална разделителна способност от 720p.
Обратно, абонатите на ChatGPT Pro на $200/месец се възползват от възможността да създават до 500 приоритетни видеоклипа (10 000 кредита), неограничени спокойни видеоклипове, удължено видео генериране до 20 секунди и опцията за изтегляне на видеоклипове без воден знак. OpenAI също така планира да въведе разнообразни ценови структури, за да отговори на нуждите на различните потребители в бъдеще.
Sora е пълен с няколко вълнуващи функции, включително функцията Remix за промяна на конкретни сегменти от видео с помощта на текстови подкани, опция Recut за разширяване на изолирани сцени, различни стилови настройки и инструменти за зацикляне и смесване на видеоклипове без усилие. Интерфейсът включва функционалност „Storyboard“, където потребителите могат да разработят поредица от видеоклипове чрез поредица от текстови подкани.
Както се очакваше, OpenAI процедира предпазливо с този видео модел. Всички генерирани видеоклипове ще включват воден знак (който абонатите на Pro могат да премахнат), заедно с C2PA метаданни, за да помогнат за проследяване на произхода на съдържанието, генерирано от Sora. Компанията също така е разработила инструмент за вътрешно търсене, който анализира техническите характеристики на видео изходите за проверка на техния произход. Тази стъпка има за цел да се бори с дезинформацията, измамите и дълбоките фалшификации.
Преди потребителите да могат да качват каквито и да било изображения или видеоклипове, те трябва да се съгласят да гарантират, че притежават правата върху тези материали и да потвърдят, че не са изобразени лица под 18 години, нито че има насилствено или явно съдържание. Общите качвания, включващи хора, ще бъдат ограничени при стартирането, като бъдещите разширения зависят от усъвършенстването на OpenAI на стратегиите за намаляване на дълбоките фалшиви данни.
Sora е достъпна независимо чрез нова платформа на sora.com. Потребителите могат да въвеждат подкани от долната част на екрана и да коригират различни настройки като предварително зададени стилове, продължителност, разделителна способност, съотношение на страните, брой варианти и други преди генериране на видео. Интерфейсът също така показва колко кредита ще бъдат изразходвани въз основа на тези параметри. По подразбиране Sora генерира четири различни вариации на всяка подкана.
Въпреки това, поради огромното търсене, регистрациите на нови акаунти за Sora са поставени на пауза. Сам Алтман заяви, че се полагат усилия за справяне с тази ситуация.
Ние значително подценихме търсенето на Sora; ще отнеме известно време, за да се осигури достъп на всички. Работим възможно най-бързо, за да разрешим това!
— Сам Алтман (@sama) 10 декември 2024 г
Ако откриете, че не можете да получите достъп до Sora или не сте плащащ абонат, все пак можете да разглеждате емисия с видеоклипове, генерирани от други потребители.
Въпреки че видеомоделът показва някои настоящи ограничения, включително трудности при създаването на реалистични видеоклипове и предизвикателства при изобразяването на сложни действия в по-дълги формати, ще бъде интригуващо да се наблюдава как той се развива и влияе върху бъдещия пейзаж на видео продукцията и потреблението.
Вашият коментар