Em fevereiro, a OpenAI apresentou o tão esperado Sora, gerando entusiasmo entre entusiastas globalmente. Agora, essa expectativa culminou com o lançamento do Sora como parte da recente série de lançamentos de produtos da OpenAI, que começou com uma assinatura do ChatGPT Pro e o lançamento do modelo o1.
O modelo de texto para vídeo capturou a atenção mundial durante sua prévia inicial, mas antes era limitado a um pequeno grupo de artistas, cineastas e testadores. Com o lançamento do Sora, os usuários agora podem produzir vídeos fornecendo prompts de texto junto com imagens e vídeos adicionais. Este modelo inovador pode gerar cenas intrincadas com vários personagens e uma variedade de movimentos. De acordo com a OpenAI, o Sora não apenas interpreta os prompts dos usuários, mas também capta como esses elementos interagem no mundo real.
Atualmente, o modelo de vídeo está acessível para assinantes do ChatGPT (tanto Plus quanto Pro) baseados nos EUA e em várias outras regiões. No entanto, o acesso é restrito em grande parte da Europa e do Reino Unido, provavelmente devido às regulamentações de privacidade digital mais rigorosas nessas áreas, que a OpenAI está trabalhando para navegar.
Assinantes do ChatGPT Plus, que custa US$ 20/mês, podem criar até 50 vídeos prioritários (totalizando 1.000 créditos), cada um com duração de até 5 segundos e resolução máxima de 720p.
Por outro lado, assinantes do ChatGPT Pro, por US$ 200/mês, se beneficiam da capacidade de produzir até 500 vídeos prioritários (10.000 créditos), vídeos relaxados ilimitados, geração de vídeo estendida de até 20 segundos e a opção de baixar vídeos sem marca d’água. A OpenAI também planeja introduzir estruturas de preços variadas para atender às diferentes necessidades dos usuários no futuro.
O Sora é repleto de vários recursos interessantes, incluindo a função Remix para alterar segmentos específicos de um vídeo usando prompts de texto, uma opção Recut para estender cenas isoladas, vários Style Presets e ferramentas para Loop e Blend vídeos sem esforço. A interface incorpora uma funcionalidade “Storyboard” onde os usuários podem desenvolver uma sequência de vídeos por meio de uma série de prompts de texto.
Conforme antecipado, a OpenAI está procedendo cautelosamente com este modelo de vídeo. Todos os vídeos gerados incluirão uma marca d’água (que os assinantes Pro podem remover), juntamente com metadados C2PA para ajudar a rastrear as origens do conteúdo gerado pelo Sora. A empresa também desenvolveu uma ferramenta de busca interna que analisa os atributos técnicos das saídas de vídeo para verificação de sua origem. Esta etapa visa combater desinformação, golpes e deepfakes.
Antes que os usuários possam fazer upload de quaisquer imagens ou vídeos, eles devem concordar em garantir que possuem os direitos sobre esses materiais e confirmar que nenhum indivíduo menor de 18 anos é retratado, nem qualquer conteúdo violento ou explícito presente. Uploads gerais com pessoas serão restritos no lançamento, com expansões futuras dependentes do refinamento das estratégias de mitigação de deepfake da OpenAI.
O Sora é acessível de forma independente por meio de uma nova plataforma em sora.com. Os usuários podem inserir prompts na parte inferior da tela e ajustar várias configurações, como estilos predefinidos, duração, resolução, proporção de aspecto, número de variações e muito mais antes da geração do vídeo. A interface também indica quantos créditos serão consumidos com base nesses parâmetros. Por padrão, o Sora gera quatro variações distintas de cada prompt.
No entanto, devido à grande demanda, novos registros de conta para Sora foram pausados. Sam Altman declarou que esforços estão em andamento para resolver essa situação.
Subestimamos significativamente a demanda por Sora; vai levar um tempo para fornecer acesso a todos. Estamos trabalhando o mais rápido possível para resolver isso!
-Sam Altman (@sama) 10 de dezembro de 2024
Caso não consiga acessar o Sora ou não seja um assinante pagante, você ainda pode navegar por um feed de vídeos gerados por outros usuários.
Embora o modelo de vídeo apresente algumas limitações atuais, incluindo dificuldades na criação de vídeos realistas e desafios na representação de ações complexas em formatos mais longos, será intrigante observar como ele evolui e influencia o cenário futuro da produção e do consumo de vídeo.
Deixe um comentário