O que você precisa saber
- Claude é um chatbot de IA construído pela Anthropic, formado em parte por ex-funcionários da Open AI.
- A Anthropic anunciou que Claude agora pode processar 100.000 tokens em sua janela de contexto.
- Isso equivale a cerca de 75.000 palavras, ou um romance inteiro. Por outro lado, o ChatGPT ainda não lançou totalmente sua janela de contexto de 32.000 tokens.
Talvez você ainda não tenha ouvido falar da Anthropic, mas essa startup de IA já está fazendo sucesso. Fundada por ex-membros da OpenAI, mais conhecida por seu modelo por trás do ChatGPT e do Bing Chat, a alternativa da Anthropic, Claude, acaba de receber uma sério atualizar.
Tudo depende da janela de contexto, e Claude agora pode fazer algo que ainda não vimos. Anthropic aumentou sua capacidade para insanos 100.000 tokens. Mas o que isso significa em inglês?
100.000 tokens equivalem a cerca de 75.000 palavras. Ou outra maneira de ver isso é que Claude pode processar um romance inteiro, algo Anthropic fez durante o teste.
“Por exemplo, carregamos todo o texto de O Grande Gatsby no Claude-Instant (72 mil tokens) e modificamos uma linha para dizer que o Sr. Carraway era ‘um engenheiro de software que trabalha com ferramentas de aprendizado de máquina na Anthropic’. Quando pedimos ao modelo para identificar o que estava diferente, ele respondeu com a resposta correta em 22 segundos.”
Isso tem enormes implicações em como Claude pode ser usado. Por outro lado, o ChatGPT ainda não lançou sua janela de contexto de 32.000 tokens no GPT-4, e o Bing Chat é baseado no GPT-4 enquanto mantendo tecnicamente seu limite em segredo.
A desvantagem é que isso não é algo que todos possam usar imediatamente para processar romances ou documentos extremamente longos e chatos, como a decisão da CMA sobre o acordo Activision/Xbox. A janela de contexto de 100.000 tokens está disponível na API, para que os desenvolvedores tenham acesso a ela.
No entanto, a escala absoluta disso é impressionante e já nos dá uma ideia de como essas ferramentas generativas de IA podem ser usadas para processar grandes quantidades de dados no futuro.