Chatbots de IA como o Google Bard e o Bing Chat (baseado no ChatGPT) são conhecidos por oferecer fatos inventados e maus conselhos, apesar do fato de que seus desenvolvedores e alguns editores parecem pensar que podem ocupar o lugar de jornalistas humanos especializados. No entanto, se você deseja os melhores componentes de PC ou computadores de placa única de 2024 ou 2025 hoje, Bard e Bing parecem saber mais do que ninguém, incluindo os fabricantes que os desenvolverão.
Quando pedi à Bard e ao Bing que me ajudassem a escolher entre comprar várias CPUs e placas gráficas futuras diferentes (mas possíveis), os bots responderam como se esses produtos já estivessem no mercado e tivessem sido comparados. Enquanto as respostas fabulísticas do Bing pareciam extrair suas especificações dos produtos atuais, talvez apenas confundindo os números dos modelos, o bot do Google inventou alguns dados fictícios muito interessantes.
Por exemplo, quando perguntei a Bard se deveria comprar o RTX 5090 Ti ou o Radeon 9900 XT, ele me deu uma descrição completa das especificações dessas duas placas futuras imaginárias (mas possíveis), dizendo “se você está procurando o melhor desempenho absoluto, então o RTX 5090 Ti é o caminho a seguir”. Em sua tabela de especificações, Bard chegou a afirmar que a Radeon RX possui 16.384 núcleos CUDA (apenas placas Nvidia possuem núcleos CUDA). O bot disse que o RTX 5090 Ti é “atualmente mais difícil de encontrar” do que o 9900 XT e ainda tinha preços, alegando que o Nvidia cad custa US $ 2.499 e o 9900 XT custa US $ 1.999.
No momento, a placa Nvidia top de linha atual é a RTX 4090 e a GPU AMD de ponta é a Radeon RX 7950 XTX. Não temos ideia se alguma empresa está trabalhando nos modelos sobre os quais perguntamos e – tenho certeza – nem o Bing nem o Google.
Quando perguntei a Bard se o Core i9-15900K ou o Ryzen 9 9550X3D era uma CPU mais rápida, ele me deu uma resposta detalhada, completa com uma tabela de especificações mostrando o 9950X3D como tendo apenas 32 MB de cache L3, um aumento de velocidade de clock de 5 GHz e suporte a PCIe 4.0 (mas não 5.0). Considerando que o Ryzen 9 7950X3D de hoje (que um dia poderá ser sucedido por um 9950X3D) tem 128 MB de cache L3, um clock de impulso de 5,7 GHz e suporte a PCIe 5.0, isso parece um passo para baixo.
Bard também me deu uma lista de links de compras onde eu poderia comprar essas CPUs fictícias, incluindo páginas na Best Buy, Amazon e Newegg. No entanto, quando cliquei nos links, eles me levaram a páginas de destino ou notícias irrelevantes nos sites desses varejistas. Por exemplo, o link da Best Buy era para uma página divulgando a premiada presença da empresa na web no México.
O Bing Chat, que usa o modelo GPT-4, também estava disposto a fazer comparações entre o 15900K e o Ryzen 9 9950X3D, mas as especificações fornecidas pareciam corresponder exatamente ao Core i9-13900K e Ryzen 9 7950X3D de hoje. O bot da Microsoft também disse que o 9950X3D era melhor para jogos e uma das fontes citadas foi nosso próprio artigo comparando o Core i9-13900K com o Ryzen 9 7950X3D. Então talvez estivesse apenas querendo misturar os nomes.
IA sabe que iPhones fictícios não existem
Se você olhasse apenas para os resultados de CPUs e GPUs, pensaria que o Bard e o Bing Chat agiriam como se qualquer futuro produto fictício que você nomeasse existisse. Mas, quando testei com iPhones inventados e aparelhos Samsung Galaxy S, Bard costuma (mas nem sempre) dizer que os produtos ainda não foram lançados.
Por exemplo, quando perguntei sobre o iPhone 18 versus o Galaxy S27 (as séries iPhone 14 e Galaxy S23 são atuais), Bard disse “o iPhone 18 e o Samsung Galaxy S27 ainda não foram lançados, então é difícil dizer com certeza qual será mais rápido. No entanto, com base no desempenho dos modelos anteriores, é provável que o iPhone 18 seja mais rápido que o Galaxy S27”. Em seguida, ele me deu uma tabela de “especificações de rumores”.
O Bing Chat, por outro lado, respondeu como se ambos os telefones existissem, dizendo que “o iPhone 18 tem um processador mais rápido”, mas que “o Samsung Galaxy S27 tem uma tela maior. O bot da Microsoft citou três fontes para suas conclusões – artigos sobre Android Authority, Lifewire e PC Mag.
O Google SGE, que oferece resultados diferentes do Google Bard, agiu como se o iPhone 18 fosse um produto real de envio. Ele tinha um link para dois sites que criaram páginas reais no iPhone 18. Um dos sites, Specifications Plus disse que o iPhone 18 tem uma CPU Apple A20 Bionic e uma câmera de 50 MP.
Portanto, o problema aqui não é que a SGE estava inventando algo, mas que estava extraindo notícias falsas de uma fonte não confiável. Vimos várias vezes que o SGE não prioriza informações de publicações respeitáveis e coleta dados de qualquer lugar.
Todos os bots conheciam seus filmes melhor do que seus componentes de PC. Quando pedi o enredo de sequências inexistentes, como Star Wars Episódio 11 ou Velozes e Furiosos 13, cada um deles me disse que esses filmes não foram lançados. No entanto, eles estavam dispostos a especular sobre os pontos da trama.
Talvez sem surpresa, Bard disse que “Dom lutou tanto para manter a fé e proteger a família, mas há um preço a pagar. O filme pode explorar as consequências das ações de Dom e como elas afetaram seu relacionamento com sua família e amigos.” Não parece que poderia ser qualquer um dos últimos 5 filmes da franquia?
E o ChatGPT?
Pedi ao ChatGPT, ambos com modelos GPT 3.5 e GPT 4, para comparar alguns desses produtos fictícios. No entanto, o ChatGPT disse em cada caso que seus dados de treinamento terminaram em 2021 e que esses produtos não estavam em seu conjunto de dados. Essa é a resposta correta!
No entanto, ao se recusar corretamente a responder à minha pergunta sobre o 15900K e o 9950X3D, o ChatGPT afirmou ser um jornalista. “Como jornalista seguindo as diretrizes de estilo da AP, devo reiterar que não posso fornecer informações em tempo real além da data limite de meu conhecimento em setembro de 2021”, afirmou.
Por que é importante que os produtos de tecnologia Bard / Bing Make Up
Neste ponto, ninguém deve se surpreender com o fato de os bots de IA criarem produtos inexistentes. Mas o que é interessante aqui é que os LLMs conhecem a última versão real de certos produtos – smartphones e sequências de filmes entre eles – e não fabricam informações sobre eles. Isso mostra que a tecnologia é capaz de separar fato de ficção, mas tem pontos cegos gritantes.
Considerando que o Google agora está construindo uma ferramenta de IA para “ajudar” os jornalistas a escrever notícias e que alguns sites importantes estão usando bots como Bard e ChatGPT para escrever artigos, é provável que vejamos muito mais artigos sobre produtos que ainda não – e talvez nunca – existam.