O que você precisa saber
- A Microsoft lançou o VASA, uma nova ferramenta capaz de transformar uma imagem estática em um clipe curto, aproveitando os recursos de IA.
- A estrutura suporta vídeos de 512×512 a até 40 FPS com latência insignificante.
- A Microsoft está explorando diferentes caminhos para garantir que a ferramenta seja usada de forma responsável antes de lançá-la ao público em geral.
Microsoft recentemente revelou VASA – uma nova estrutura que gera “rostos falantes realistas de personagens virtuais com habilidades afetivas visuais (VAS) atraentes, com uma única imagem estática e um clipe de áudio de fala.”
O VASA-1 pode transformar uma imagem estática em um clipe curto, produzindo movimentos labiais que sincronizam perfeitamente com um clipe de áudio de fala. Curiosamente, a sofisticada tecnologia de ponta torna a criação gerada por IA realista ao “capturar um amplo espectro de nuances faciais e movimentos naturais da cabeça que contribuem para a percepção de autenticidade e vivacidade”.
A VASA da Microsoft alimentará deepfakes generalizados?
Com o surgimento da IA, houve um aumento no surgimento de deepfakes nas plataformas de mídia social e na desinformação generalizada gerada pela IA sobre as eleições. E agora, com uma ferramenta sofisticada como a VASA-1, capaz de fornecer alta qualidade de vídeo com dinâmicas faciais e de cabeça realistas a partir de imagens estáticas, uma grande preocupação pode ser como isso afetará notícias ou informações factuais e confiáveis da Internet.
A ferramenta suporta vídeos de 512×512 a até 40 FPS com latência insignificante. Acontece que recentemente me deparei com um vídeo semelhante aos clipes gerados pela VASA da Microsoft no LinkedIn. Percebi que o vídeo estava um pouco errado em alguns aspectos, como tom, lábios e movimentos da cabeça.
À medida que mais pessoas continuam a adotar a IA, ferramentas como VASA e Image Creator do Designer melhorarão na geração de imagens e clipes. Eles já estão levantando preocupações entre os profissionais do setor de ambientes construídos, pois são bons na geração de projetos estruturais e podem torná-los obsoletos.
Recentemente, relatamos um incidente bizarro em que um popular rapper canadense usou IA para gerar um verso usando a voz de um rapper falecido sem a aprovação de seu espólio e o incluiu em uma faixa. Da mesma forma, o fluxo na faixa dissimulada estava errado, mas a voz do falecido rapper era estranha.
A Microsoft indica que não tem planos de lançar “uma demonstração online, API, produto, detalhes adicionais de implementação ou quaisquer ofertas relacionadas”, até que tenha medidas elaboradas para regular e garantir que as ofertas da ferramenta sejam usadas de forma responsável.