O que você acha dos chatbots de IA que usam recursos protegidos por direitos autorais sem compensação e varrem o problema para debaixo do tapete como “uso justo”?

O que você precisa saber

A OpenAI se viu nos corredores da justiça depois de ser alvo de vários processos judiciais por violação de direitos autorais.

A empresa admite que é impossível criar chatbots de IA sem usar material protegido por direitos autorais da Internet.

Destacou que a lei de direitos autorais não proíbe o treinamento durante a submissão.

Embora o fiasco da OpenAI que levou seu conselho de administração a destituir Sam Altman de seu cargo de CEO na empresa esteja fora do caminho, a empresa não consegue fazer uma pausa, pois aparentemente mais problemas estão se formando. No final de 2023, o The New York Times anunciou publicamente seus planos de processar a Microsoft e a OpenAI por causa do uso injusto de IA de seu material protegido por direitos autorais, o que impactou negativamente o meio de comunicação monetariamente.

Recentemente entrando na briga, dois autores de não ficção entraram com uma ação coletiva contra a Microsoft e a OpenAI por roubo de propriedade intelectual, reivindicando ainda US$ 150.000 como restituição por danos. Para quem não sabe, chatbots com tecnologia de IA, como ChatGPT da OpenAI ou Copilot da Microsoft (anteriormente Bing Chat), são fortemente roubar contar com informações e recursos já existentes na Internet (predominantemente de sites) para fins de treinamento. A questão aqui é que os chatbots de IA usam as informações para selecionar respostas específicas e detalhadas às consultas, com atribuição “sutil” à fonte. Além do mais, nenhuma compensação é fornecida aos criadores de conteúdo por usarem seu trabalho para treinar esses modelos. OpenAI recentemente admitido que é literalmente “impossível” criar ferramentas como o ChatGPT sem material protegido por direitos autorais da Internet e ao mesmo tempo submeter sua defesa ao comitê de comunicações e seleção digital da Câmara dos Lordes. Para que um chatbot de IA forneça informações precisas aos usuários, ele deve consultar vastos recursos já existentes na Internet. No entanto, a diferença é que praticamente tudo na Internet atualmente é protegido por direitos autorais.

Dado que os direitos de autor abrangem hoje praticamente todo o tipo de expressão humana – incluindo publicações em blogs, fotografias, publicações em fóruns, fragmentos de código de software e documentos governamentais – seria impossível treinar os principais modelos de IA da atualidade sem utilizar materiais protegidos por direitos de autor.

OpenAIA OpenAI indicou que limitar seu conjunto de dados de treinamento a materiais livres de direitos autorais criaria chatbots de IA que não atenderiam aos requisitos mínimos do usuário médio. De acordo com a estratégia de submissão e defesa da empresa, é evidente que o “uso justo” de conteúdo protegido por direitos autorais é a sua salvação. O uso justo de recursos de direitos autorais cria uma área cinzenta, apresentando, em última análise, um cenário onde os chatbots podem obter e usar informações protegidas por direitos autorais sem necessariamente solicitar primeiro a permissão do proprietário. “Legalmente, a lei de direitos autorais não proíbe o treinamento”, acrescentou OpenAI.

Não há IA sem conteúdo protegido por direitos autorais(Crédito da imagem: Daniel Rubino)OpenAI, uma das empresas mais procuradas quando se trata de IA generativa, admitiu abertamente que é quase impossível criar chatbots com tecnologia de IA como o ChatGPT sem usar material protegido por direitos autorais para treinar os modelos. Isto apesar de ter acesso ilimitado aos recursos da Microsoft, além do seu investimento inicial multibilionário na tecnologia. Nos últimos meses, o ChatGPT sofreu vários contratempos, incluindo relatos de que está ficando mais burro e um declínio em sua base de usuários. Isso ocorre em meio a especulações de que a OpenAI está esgotada e à beira da falência. É verdade que é muito caro administrar um chatbot diariamente. Falando figurativamente, são cerca de 700.000 por dia e uma garrafa de água por consulta para resfriamento. Um relatório destacou que a IA generativa poderia consumir energia para abastecer um pequeno condado até 2027 durante um ano.

Enquanto o assunto ainda estiver em tribunal, será interessante ver como as coisas vão evoluir. O presidente Biden emitiu uma ordem executiva abordando questões de segurança e privacidade relacionadas à IA, mas as proteções para a tecnologia continuam sendo uma grande preocupação entre a maioria dos usuários.

Chatbots de IA foram vistos tendo alucinações lúcidas, recomendando erroneamente um Banco de Alimentos como atração turística e até pedindo aos leitores que participassem de uma enquete para determinar a causa do infeliz falecimento de uma mulher. Se isso acontecesse enquanto os chatbots tinham acesso a material protegido por direitos autorais, levantaria muita preocupação sobre quanto dano a tecnologia causaria quando restrita a dados livres de direitos autorais. Enquanto isso, o Bard do Google poderia subir na hierarquia tendo acesso ilimitado a toda a Internet.

O que você acha dos chatbots de IA que usam recursos protegidos por direitos autorais sem compensação e varrem o problema para debaixo do tapete como “uso justo”? Deixe-nos saber nos comentários.

OpenAI admite que é “impossível” criar ferramentas semelhantes ao ChatGPT sem usar material protegido por direitos autorais, em meio a batalhas judiciais por alegações de roubo de propriedade intelectual

Links rápidos