Estreia do gerador de texto para vídeo OpenAI Sora – os resultados podem ser surpreendentes, mas os bugs permanecem

A OpenAI, pioneira em inteligência artificial, apresentou na quinta-feira uma nova ferramenta generativa. Chamada Sora (a palavra japonesa para céu), é o projeto mais ambicioso da OpenAI até o momento, sendo capaz de gerar vídeos complexos e em alta definição de até um minuto a partir de um simples prompt de texto. Também é possível usar prompts de imagem. No entanto, o acesso ao Sora continua restrito a um grupo selecionado de pesquisadores e profissionais visuais, enquanto a OpenAI aprimora sua oferta e implementa medidas de segurança para garantir que a ferramenta não seja usada para criar desinformação ou conteúdo de ódio.

Um exemplo de prompt para Sora foi “Uma mulher elegante caminha por uma rua de Tóquio cheia de neon brilhante e sinalização animada da cidade. Ela usa uma jaqueta de couro preta, um vestido longo vermelho e botas pretas”.

Em seu blog, a OpenAI explicou que o Sora foi projetado para gerar cenas complexas com múltiplos personagens e detalhes precisos e realistas. No entanto, ainda reconhece que a ferramenta tem dificuldades para simular com precisão a física de uma cena complexa e pode não compreender instâncias específicas de causa e efeito.

A OpenAI está trabalhando com os primeiros testadores para evitar que a ferramenta seja usada para gerar desinformação, conteúdo de ódio e preconceito. Além disso, está tomando medidas para prevenir e detectar conteúdo proibido, como violência extrema, conteúdo sexual, imagens de ódio, semelhanças de celebridades ou propriedade intelectual de terceiros.

Sora representa um avanço significativo na geração de texto para vídeo, e seu impacto será sentido além do setor de tecnologia e informática.

Estreia do gerador de texto para vídeo OpenAI Sora – os resultados podem ser surpreendentes, mas os bugs permanecem

Links rápidos