O que você precisa saber
- Um relatório emergente indica que o Reddit está no meio de um mega acordo com uma grande empresa de IA não identificada, avaliada em US$ 60 milhões anualmente.
- O acordo poderia permitir que a empresa usasse o conteúdo do Reddit para treinar seus modelos de IA.
- Mais detalhes sobre o acordo, a identidade da empresa e o que pretende fazer com o conteúdo que obtém do Reddit permanecem obscuros.
A IA generativa é um tema importante no cenário tecnológico à medida que mais empresas continuam a aproveitá-la e a integrá-la em seus fluxos de trabalho. No último ano e nas mudanças, vimos pessoas usando IA para alcançar novos patamares e aproveitar novas oportunidades na educação, medicina, computação e muito mais.
Embora isto seja impressionante, há uma preocupação crescente em torno das medidas de segurança e privacidade em vigor para evitar que a IA fique fora de controlo. Somando-se a isso, há também a questão de empresas como Microsoft e OpenAI roubando usando informações protegidas por direitos autorais para treinar seus modelos.
No início deste ano, a Microsoft e a OpenAI foram alvo de ações judiciais por roubo de propriedade intelectual pelo The New York Times e dois autores não-ficcionais. As empresas argumentam que a lei de direitos autorais não proíbe o uso de material protegido por direitos autorais para treinar modelos de IA.
Curiosamente, Sam Altman, CEO da OpenAI, admitiu que é virtualmente impossível criar ferramentas semelhantes ao ChatGPT sem usar material protegido por direitos autorais, indicando ainda que restringir o treinamento dessas ferramentas a material livre de direitos autorais criaria chatbots de IA que não podem atender aos requisitos mínimos do usuário médio.
As restrições de direitos autorais explicam o aumento de relatos de chatbots como o ChatGPT da OpenAI ficando mais burros e o declínio da precisão do Microsoft Copilot (anteriormente Bing Chat). Na verdade, uma grande empresa de IA está supostamente no meio de um novo acordo de licenciamento com o Reddit no valor de “cerca de US$ 60 milhões anualmente”, de acordo com um anúncio de Bloomberg.
O acordo poderia potencialmente levar a empresa não identificada a usar postagens do Reddit para treinar seus modelos de IA, embora os detalhes em torno deste acordo permaneçam escassos e deixados para especulação. O Reddit abriga informações confiáveis em seus subreddits, juntamente com comentários e interações de usuários ávidos. Como tal, é uma mina de ouro e uma ferramenta confiável que pode ser aproveitada para aprimorar e melhorar ainda mais as capacidades dos LLMs.
Finalmente a compensação, mas a que custo?
Durante o que parece uma eternidade, empresas como a Microsoft e a OpenAI simplesmente recolhem informações de websites e empacotam-nas como se fossem suas, em formato reduzido, sem se preocuparem com referências à fonte ou mesmo com compensação.
Foi apenas no ano passado, em dezembro, que foi relatado que a OpenAI estava no meio de um mega acordo com a editora alemã Axel Springer, que a fará desembolsar dezenas de milhões de euros em 3 anos (uma primeira vez, se você me perguntar). Em troca, a empresa de tecnologia terá acesso a artigos (arquivados e atuais) da editora para treinar seus modelos de IA.
No entanto, permanece incerto que tipo de recepção isso terá. O Reddit teve seu quinhão de problemas e desafios nos últimos anos. Você deve se lembrar do fiasco do ano passado, quando a empresa anunciou seus planos de começar a cobrar pelo acesso às suas APIs. Um movimento que levou ao encerramento de milhares de fóruns em protesto contra a mudança, o que consequentemente levou ao colapso do site.