O que você precisa saber
- A OpenAI anunciou recentemente que agora marcará imagens geradas usando ChatGPT ou API que atende a tecnologia DALL-E 3.
- Isso ajudará os usuários a identificar imagens geradas usando essas ferramentas de IA, desmistificando-as claramente de imagens reais/reais.
- Esta alteração aplica-se apenas a imagens; não afetará voz ou texto gerado por IA.
Em meio à prevalência de deepfakes de IA e desinformação na web, OpenAI anunciado medidas que estão sendo tomadas para combater esse problema. Imagens geradas usando ChatGPT ou API que atende a tecnologia DALL-E 3 agora apresentarão marcas d’água. Esta é a aposta da empresa para promover mais transparência, já que a marca d’água informará às pessoas que uma imagem é gerada por IA.
A marca d’água incluirá informações detalhadas, incluindo quando a imagem foi gerada e o logotipo C2PA. No entanto, a OpenAI admite que incorporar a Coalition for Content Provenance and Authenticity (C2PA) na tecnologia DALL-E 3 e ChatGPT não é “uma solução mágica para resolver questões de proveniência”. A empresa ainda destacado que:
“Metadados como C2PA não são uma solução mágica para resolver questões de proveniência. Eles podem ser facilmente removidos, acidental ou intencionalmente. Por exemplo, a maioria das plataformas de mídia social hoje removem metadados de imagens carregadas, e ações como tirar uma captura de tela também podem removê-los. Portanto, uma imagem sem esses metadados pode ou não ter sido gerada com ChatGPT ou nossa API.”
É importante notar que essa alteração pode impactar levemente os tamanhos dos arquivos das imagens geradas com essas ferramentas. No entanto, isso não afetará a qualidade das fotos. Veja como os metadados C2PA podem impactar o tamanho das imagens geradas por IA:
- 3,1 MB → 3,2 MB para PNG por meio de API (aumento de 3%)
- 287 mil → 302 mil para WebP por meio de API (aumento de 5%)
- 287 mil → 381 mil para WebP por meio de ChatGPT (aumento de 32%)
Espera-se que a mudança seja implementada para usuários móveis na próxima semana, em 12 de fevereiro de 2024.
A marca d’água é um passo na direção certa, mas será suficiente?
Uma das coisas que me fascina na IA generativa é a capacidade de aproveitar a tecnologia para gerar imagens realistas usando prompts baseados em texto em segundos. Ferramentas baseadas em IA projetadas para esse propósito específico, como Image Creator do Designer (anteriormente Bing Image Creator) e ChatGPT, só melhoraram com o tempo.
No entanto, nem tudo foi divertido e glamoroso. O Image Creator from Designer da Microsoft aproveita Tecnologia DALL-E 3 da OpenAI, o que elevou seus recursos de geração de imagens para o próximo nível. É certo que a ferramenta de IA gera imagens mais bonitas em comparação com as versões anteriores.
Infelizmente, o entusiasmo durou pouco devido ao aumento do número de denúncias que surgiram online, citando casos em que a ferramenta foi usada para gerar conteúdo ofensivo e explícito. Isso forçou a Microsoft a colocar barreiras de proteção e aumentar a censura na ferramenta de geração de imagens para evitar o uso indevido.
Embora essas medidas desempenhem um papel crucial no estabelecimento do controle sobre a ferramenta, alguns usuários sentiram que a Microsoft exagerou um pouco na censura, acabando por lobotomizá-la.
RELACIONADO: A nova ferramenta de geração de imagens do Google permite ajustar os resultados
Algumas semanas atrás, imagens explícitas da conhecida estrela pop Taylor Swift se tornaram virais em plataformas de mídia social, apenas para que a verdade viesse à tona mais tarde, revelando que eram deepfakes de IA que se acredita terem sido gerados usando o Microsoft Designer.
Parece que quanto mais censura estas ferramentas sofrem, mais difícil se torna explorar e aproveitar plenamente as suas capacidades.