O que você precisa saber
- OpenAI estreou recentemente um novo modelo de IA chamado Sora com recursos de geração de vídeo.
- O modelo de texto para vídeo pode gerar vídeos de até um minuto, mantendo alta qualidade e aderência às instruções do usuário.
- No entanto, Sora luta para simular a física de uma cena complexa e compreender instâncias específicas de causa e efeito.
No início do ano, Bill Gates da Microsoft e Sam Altman da OpenAI tocaram no podcast Unconfuse Me. Os dois líderes revolucionários discutiram tudo que girava em torno do fabricante do ChatGPT, incluindo a demissão e recontratação de Altman, o desenvolvimento do GPT-5, superinteligência e muito mais.
Sam Altman também discutiu a possibilidade de envio de recursos de vídeo para o chatbot com tecnologia de IA da empresa, uma vez que é a principal solicitação da maioria dos usuários. Ele acrescentou que esta adição se basearia no modo de voz e nos recursos de geração de imagem já existentes.
E agora, apenas um mês depois de compartilhar essas informações, a OpenAI revelou um novo modelo de texto para vídeo denominado Sora. O modelo de IA “pode gerar vídeos de até um minuto, mantendo a qualidade visual e a aderência às instruções do usuário”.
Anunciando Sora – nosso modelo que cria vídeos de um minuto a partir de um prompt de texto: https://t.co/SZ3OxPnxwz pic.twitter.com/0kzXTqK9bG15 de fevereiro de 2024
Vale ressaltar que o modelo não estará disponível para acesso imediato de todos. A OpenAI está enviando a ferramenta exclusivamente para “red teamers”, artistas visuais, designers e cineastas que avaliarão áreas potenciais de danos e riscos.
Além disso, isso criará um caminho para profissionais experientes da indústria cinematográfica fornecerem feedback e sugerirem novas maneiras para a OpenAI avançar e melhorar o modelo.
Embora o modelo seja fornecido com um profundo conhecimento da linguagem que lhe permite interpretar corretamente os prompts de texto e gerar caracteres realistas, a OpenAI admite que também tem seu quinhão de pontos fracos.
A empresa destacou que o modelo pode enfrentar desafios ao tentar simular a física de uma cena complexa. Também pode ter dificuldade em compreender casos específicos de causa e efeito. De acordo com um exemplo fornecido pela OpenAI para explicar melhor essa premissa, “uma pessoa pode dar uma mordida em um biscoito, mas depois o biscoito pode não ter marca de mordida”.
Sora também tem a capacidade de gerar um vídeo com múltiplas tomadas que “persistem com precisão os personagens e o estilo visual”. No entanto, pode ser insuficiente no que diz respeito aos detalhes espaciais de um prompt. Por exemplo, pode ser difícil decifrar a direita da esquerda ou até mesmo eventos específicos que ocorrem ao longo do tempo.
IA pode tornar obsoletas mais profissões
Além dos tempos económicos difíceis, a IA generativa vem em segundo lugar quando se trata de factores que afectam negativamente a segurança do emprego. Chatbots com tecnologia de IA, como Microsoft Copilot e ChatGPT, já estão reivindicando empregos de jornalistas. Vimos várias publicações demitirem alguns de seus funcionários em favor desses chatbots de IA, e isso acabou sendo uma bagunça. A Microsoft introduziu um novo programa concebido para dotar os jornalistas de competências que
Gostaríamos de lhe enviar notificações com novidades, você pode cancelar a qualquer momento.