A febbraio, OpenAI ha introdotto l’attesissimo Sora, accendendo l’entusiasmo tra gli appassionati in tutto il mondo. Ora, quell’attesa è culminata con il lancio di Sora come parte della recente serie di rilasci di prodotti di OpenAI, iniziata con un abbonamento a ChatGPT Pro e il lancio del modello o1.
Il modello text-to-video ha catturato l’attenzione mondiale durante la sua anteprima iniziale, ma in precedenza era limitato a un piccolo gruppo di artisti, registi e tester. Con il lancio di Sora, gli utenti possono ora produrre video fornendo prompt di testo insieme a immagini e video aggiuntivi. Questo modello innovativo può generare scene complesse con più personaggi e una varietà di movimenti. Secondo OpenAI, Sora non solo interpreta i prompt degli utenti, ma comprende anche come questi elementi interagiscono nel mondo reale.
Attualmente, il modello video è accessibile agli abbonati di ChatGPT (sia Plus che Pro) con sede negli Stati Uniti e in varie altre regioni. Tuttavia, l’accesso è limitato in gran parte dell’Europa e del Regno Unito, probabilmente a causa delle più severe normative sulla privacy digitale in queste aree, che OpenAI sta cercando di superare.
Gli abbonati a ChatGPT Plus, al prezzo di 20 $ al mese, possono creare fino a 50 video prioritari (per un totale di 1.000 crediti), ciascuno della durata massima di 5 secondi, con una risoluzione massima di 720p.
Al contrario, gli abbonati a ChatGPT Pro, a $ 200/mese, beneficiano della possibilità di produrre fino a 500 video prioritari (10.000 crediti), video rilassati illimitati, generazione di video estesa fino a 20 secondi e l’opzione di scaricare video senza filigrana. OpenAI prevede inoltre di introdurre strutture di prezzo diverse per soddisfare le diverse esigenze degli utenti in futuro.
Sora è ricco di diverse funzionalità entusiasmanti, tra cui la funzione Remix per modificare segmenti specifici di un video utilizzando prompt di testo, un’opzione Recut per estendere scene isolate, vari Style Preset e strumenti per Loop e Blend video senza sforzo. L’interfaccia incorpora una funzionalità “Storyboard” in cui gli utenti possono sviluppare una sequenza di video tramite una serie di prompt di testo.
Come previsto, OpenAI sta procedendo con cautela con questo modello video. Tutti i video generati includeranno una filigrana (che gli abbonati Pro possono rimuovere), insieme ai metadati C2PA per aiutare a tracciare le origini dei contenuti generati da Sora. L’azienda ha anche sviluppato uno strumento di ricerca interno che analizza gli attributi tecnici degli output video per verificarne l’origine. Questo passaggio mira a combattere la disinformazione, le truffe e i deepfake.
Prima che gli utenti possano caricare immagini o video, devono accettare di assicurarsi di possedere i diritti su questi materiali e confermare che non siano raffigurati individui di età inferiore ai 18 anni, né che siano presenti contenuti violenti o espliciti. I caricamenti generici che mostrano persone saranno limitati al lancio, con future espansioni subordinate al perfezionamento delle strategie di mitigazione dei deepfake da parte di OpenAI.
Sora è accessibile in modo indipendente tramite una nuova piattaforma su sora.com. Gli utenti possono immettere prompt dalla parte inferiore dello schermo e regolare varie impostazioni come stili predefiniti, durata, risoluzione, aspect ratio, numero di varianti e altro ancora prima della generazione del video. L’interfaccia indica anche quanti crediti saranno consumati in base a tali parametri. Per impostazione predefinita, Sora genera quattro varianti distinte di ciascun prompt.

Tuttavia, a causa della domanda travolgente, le registrazioni di nuovi account per Sora sono state sospese. Sam Altman ha dichiarato che sono in corso degli sforzi per risolvere questa situazione.
Abbiamo notevolmente sottostimato la domanda per Sora; ci vorrà un po’ per garantire l’accesso a tutti. Stiamo lavorando il più velocemente possibile per risolvere il problema!
— Sam Altman (@sama) 10 dicembre 2024
Se non riesci ad accedere a Sora o non sei un abbonato pagante, puoi comunque sfogliare un feed di video generati da altri utenti.
Sebbene il modello video presenti alcuni limiti attuali, tra cui difficoltà nel creare video realistici e difficoltà nel rappresentare azioni complesse in formati più lunghi, sarà interessante osservare come evolverà e influenzerà il futuro panorama della produzione e del consumo di video.
Lascia un commento