Cuidado, Hollywood! O modelo mais recente da OpenAI gera vídeos de IA realistas de um minuto, mas tem alguns pontos fracos críticos

Sora luta com a mensagem “Arqueólogos descobrem uma cadeira de plástico genérica no deserto, escavando-a e tirando o pó dela com muito cuidado”.
(Crédito da imagem: OpenAI)

O que você precisa saber

OpenAI estreou recentemente um novo modelo de IA chamado Sora com recursos de geração de vídeo.
O modelo de texto para vídeo pode gerar vídeos de até um minuto, mantendo alta qualidade e aderência às instruções do usuário.
No entanto, Sora luta para simular a física de uma cena complexa e compreender instâncias específicas de causa e efeito.

No início do ano, Bill Gates da Microsoft e Sam Altman da OpenAI tocaram no podcast Unconfuse Me. Os dois líderes revolucionários discutiram tudo que girava em torno do fabricante do ChatGPT, incluindo a demissão e recontratação de Altman, o desenvolvimento do GPT-5, superinteligência e muito mais.

Sam Altman também discutiu a possibilidade de envio de recursos de vídeo para o chatbot com tecnologia de IA da empresa, uma vez que é a principal solicitação da maioria dos usuários. Ele acrescentou que esta adição se basearia no modo de voz e nos recursos de geração de imagem já existentes.

E agora, apenas um mês depois de compartilhar essas informações, a OpenAI revelou um novo modelo de texto para vídeo denominado Sora. O modelo de IA “pode gerar vídeos de até um minuto, mantendo a qualidade visual e a aderência às instruções do usuário”.

Anunciando Sora – nosso modelo que cria vídeos de um minuto a partir de um prompt de texto: https://t.co/SZ3OxPnxwz pic.twitter.com/0kzXTqK9bG15 de fevereiro de 2024

Ver mais

Vale ressaltar que o modelo não estará disponível para acesso imediato de todos. A OpenAI está enviando a ferramenta exclusivamente para “red teamers”, artistas visuais, designers e cineastas que avaliarão áreas potenciais de danos e riscos.

Além disso, isso criará um caminho para profissionais experientes da indústria cinematográfica fornecerem feedback e sugerirem novas maneiras para a OpenAI avançar e melhorar o modelo.

Sora é capaz de gerar cenas complexas com vários personagens, tipos específicos de movimento e detalhes precisos do assunto e do fundo. O modelo entende não apenas o que o usuário pediu no prompt, mas também como essas coisas existem no mundo físico.
OpenAI

Embora o modelo seja fornecido com um profundo conhecimento da linguagem que lhe permite interpretar corretamente os prompts de texto e gerar caracteres realistas, a OpenAI admite que também tem seu quinhão de pontos fracos.

A empresa destacou que o modelo pode enfrentar desafios ao tentar simular a física de uma cena complexa. Também pode ter dificuldade em compreender casos específicos de causa e efeito. De acordo com um exemplo fornecido pela OpenAI para explicar melhor essa premissa, “uma pessoa pode dar uma mordida em um biscoito, mas depois o biscoito pode não ter marca de mordida”.

Sora também tem a capacidade de gerar um vídeo com múltiplas tomadas que “persistem com precisão os personagens e o estilo visual”. No entanto, pode ser insuficiente no que diz respeito aos detalhes espaciais de um prompt. Por exemplo, pode ser difícil decifrar a direita da esquerda ou até mesmo eventos específicos que ocorrem ao longo do tempo.

IA pode tornar obsoletas mais profissões

$Cuidado, Hollywood! O modelo mais recente da OpenAI gera vídeos de IA realistas de um minuto, mas tem alguns pontos fracos críticos 4$

(Crédito da imagem: Future | Image Creator do Designer)

Além dos tempos económicos difíceis, a IA generativa vem em segundo lugar quando se trata de factores que afectam negativamente a segurança do emprego. Chatbots com tecnologia de IA, como Microsoft Copilot e ChatGPT, já estão reivindicando empregos de jornalistas. Vimos várias publicações demitirem alguns de seus funcionários em favor desses chatbots de IA, e isso acabou sendo uma bagunça. A Microsoft introduziu um novo programa concebido para dotar os jornalistas de competências que

Gostaríamos de lhe enviar notificações com novidades, você pode cancelar a qualquer momento.

Você está inscrito.

Cuidado, Hollywood! O modelo mais recente da OpenAI gera vídeos de IA realistas de um minuto, mas tem alguns pontos fracos críticos

O que você precisa saber

Links rápidos