1 minuto do vídeo Sora da OpenAI pode levar mais de uma hora para gerar
O modelo de IA recentemente revelado da OpenAI, Sora, gera vídeos realistas a partir de prompts de texto. No entanto, as discussões sugerem que gerar um único minuto de vídeo usando Sora pode levar mais de uma hora.
Embora o período exato ainda não esteja claro, este post no Reddit indica tempos de renderização significativos em comparação com os métodos tradicionais de criação de vídeo. É importante notar que essas discussões são baseadas em informações limitadas, com os pesquisadores exibindo principalmente exemplos pré-selecionados e não permitindo o acesso público a prompts personalizados. O vídeo mais longo demonstrado teve apenas 17 segundos de duração.
Várias perspectivas têm surgido em relação a esses tempos de renderização. Alguns usuários comentaram sobre a impraticabilidade de longos tempos de renderização, particularmente ao iterar através de vários prompts:
Se você precisar tentar vários prompts, isso será um grande problema.
Outros especularam sobre as possíveis razões por trás dos longos tempos de renderização, com um usuário fazendo referência a comentários do CEO da OpenAI, Sam Altman, sobre necessidades significativas de financiamento:
Vejo por que ele (Sam Altman) quer 7 trilhões agora.
Comparações também foram feitas com outro modelo de IA anunciado recentemente, o Gemini 1.5 do Google, destacando o cenário competitivo:
Comentário por u/hasanahmad da discussão no OpenAI
Finalmente, alguns usuários tentaram contextualizar os tempos de renderização comparando-os com a animação tradicional:
Isso é bastante razoável. 90 horas para um filme de 90 minutos. Quando você calcula a economia para todo o trabalho típico de animação, isso não é loucura. Mas supondo zero tiros, 100% de precisão, zero alucinações e 100% de transferência de personagens durante a maior parte do filme,
Uma das coisas mais perceptíveis é que o tempo não é surpreendente, mas a ausência de 1 minuto me diz que depois de 20 segundos, ele pode começar a alucinar muito, o que atualmente é conhecido para LLMs.
No geral, as informações sobre os tempos de renderização do Sora ressaltam o estágio de desenvolvimento contínuo da tecnologia. Embora o potencial para a criação de vídeos gerados por IA seja evidente, abordar a eficiência e a escalabilidade continua sendo crucial para uma adoção mais ampla.
À medida que Sora continua a evoluir, será interessante ver como esses desafios são enfrentados e como a tecnologia molda o futuro da criação de vídeos.
FONTE: MS Power User