O que você precisa saber
- O Google anunciou recentemente que Bard, ImageFX, Search e Vertex AI serão executados em seu modelo Imagen 2 atualizado.
- A empresa promete imagens geradas por IA mais detalhadas e de qualidade, já que o modelo é treinado em “pares de descrição de imagem e de maior qualidade”.
- A empresa também lançou uma nova ferramenta de geração de imagens chamada ImageFX, que é semelhante ao Image Creator da Designer da Microsoft.
- Curiosamente, a ferramenta permite ajustar suas imagens, permitindo alterar seu prompt usando chips expressivos.
O Google está dobrando seu foco em IA, lançando recentemente seu modelo Imagen 2 atualizado para Bard, ImageFX, Search e Vertex AI. O novo modelo coloca o Google em condições de igualdade para competir DALL-E 3 da OpenAImeio da jornada e muito mais.
De acordo com o Google, o novo modelo é alimentado pelos mais recentes avanços de texto para imagem do Google DeepMind. Além do mais, ele é treinado em pares de descrição de imagem e qualidade superior. Isso permitirá que o modelo gere “imagens mais detalhadas que estão melhor alinhadas com a semântica das instruções de linguagem das pessoas”. Como tal, o Google Bard agora poderá competir com o Microsoft Copilot em igualdade de condições.
A empresa também revelou uma ferramenta experimental de geração de imagens chamada ImageFX. Assim como o Microsoft Copilot, ele gera imagens com base em prompts de texto. Mas o que o diferencia de outras ferramentas de geração de imagens é que você pode modificar seu prompt usando chips expressivos, permitindo que você ajuste ainda mais a saída. O Google explica que o ImageFX foi “projetado para experimentação e criatividade”. Os usuários podem acessar a ferramenta via Cozinha de teste de IA do Googleonde também podem criar e interagir com outros experimentos generativos, como MusicFX e TextFX.
Aconteceu que eu teste a ferramenta experimental ImageFX, e é muito legal. É muito rápido também; gerar a imagem que eu queria levou apenas uma fração de segundo. Isso se soma aos chips expressivos, que permitem alterar/alterar seu prompt.
Tentei recriar a mesma imagem em Criador de imagens do Bing Image Creator do Designer e percebi que era um pouco mais lento que o ImageFX. No entanto, as imagens geradas foram muito boas. No entanto, ImageFX parece mais realista e realista, na minha opinião.
É importante notar que você também pode alterar o prompt de texto no Image Creator do Microsoft Designer. Ainda assim, está essencialmente dando outro prompt à ferramenta para gerar uma nova imagem (começando do zero). É por isso que considero os chips expressivos da ferramenta experimental do Google tão eficazes e eficientes.
Isso está acontecendo em meio à prevalência de deepfakes de IA na Internet. No entanto, o Google incorporou um link para suas políticas de privacidade e termos de serviço na interface do usuário do ImageFX, que especifica amplamente o que você pode ou não fazer usando a ferramenta. Há uma necessidade óbvia de regulamentação de tais ferramentas para evitar o uso indevido.
A Microsoft já lançou uma nova atualização para o Microsoft Designer, que se acredita ser a ferramenta usada para gerar conteúdo sexualmente explícito com a estrela pop Taylor Swift. A atualização regula e impede que os usuários gerem conteúdo explícito na plataforma, juntamente com a recém-imposta Lei Disrupt Explicit Forged Images and Non-Consensual Edits (DEFIANCE), projetada para regular e prevenir tais ocorrências.
A censura é uma das principais razões pelas quais a maioria dos usuários sente que o Image Creator by Designer foi lobotomizado. Não posso deixar de me perguntar qual será o impacto que as regras e regulamentos recentemente impostos terão nas ferramentas de geração de imagens e na IA em geral, no longo prazo.
CONSULTE MAIS INFORMAÇÃO: A Microsoft pode proteger as eleições dos EUA contra deepfakes e desinformação de IA
Em outro lugar, MusicFX, a ferramenta de conversão de texto para música do Google, também está recebendo o recurso de chips expressivos, o que significa que além de criar música usando prompts de até 70 segundos com a opção de ajustar o andamento, você pode ajustar a letra com base em sua preferência .
Você também pode experimentar essas ferramentas experimentais se estiver nos EUA, Nova Zelândia, Quênia e Austrália.