
Na semana passada, a Anthropic cortou o acesso de ferramentas de terceiros às chamadas de API através das subscrições Claude Pro e Max. A decisão gerou uma onda imediata de críticas por parte dos programadores que tinham construído os seus fluxos de trabalho em torno desse acesso. No entanto, o que muitos viram apenas como uma plataforma a defender as suas receitas, é na verdade o sintoma de uma falha estrutural insustentável na forma como a indústria cobra pelas ferramentas de código.
Segundo uma análise detalhada publicada no Hello China Tech, a visão parte de Luo Fuli, líder da equipa do grande modelo MiMo da Xiaomi e antiga funcionária da DeepSeek. A especialista publicou um fio de mensagens que rapidamente circulou nos círculos tecnológicos chineses, classificando a medida como algo que não surpreende. Luo Fuli deixou um aviso claro: vender pacotes ilimitados a preços reduzidos enquanto se deixa a porta escancarada para ferramentas externas parece ótimo para os utilizadores, mas é uma armadilha financeira.
O colapso das subscrições ilimitadas
A análise de Luo Fuli foca-se na mecânica dos preços fixos. Uma subscrição mensal fixa assume uma distribuição de utilização, tal como acontece nos ginásios ou nos planos de dados móveis, onde os utilizadores mais leves subsidiam os mais pesados. A estrutura nativa da criadora do Claude gere o contexto de forma cuidadosa, maximiza a reutilização da cache e consolida as chamadas de ferramentas para manter os custos de cada pesquisa dentro de limites aceitáveis.
O problema surgiu quando as estruturas de agentes de terceiros destruíram esta distribuição. A especialista analisou de perto a gestão de contexto de ferramentas como o OpenClaw e classificou-a como péssima. Numa única pesquisa de um utilizador, a ferramenta dispara rondas de chamadas de baixo valor como pedidos de API separados, cada um a carregar uma longa janela de contexto que excede frequentemente os 100.000 tokens. A contagem real de pedidos por pesquisa é várias vezes superior ao que a estrutura nativa do Claude Code geraria.
O pesadelo da cache e o custo real
Este cenário agrava-se com a quebra do sistema de cache. O sistema depende de prefixos consistentes no contexto da conversa para reaproveitar a computação anterior e saltar processamentos redundantes. O problema é que muitas destas ferramentas externas comprimem as respostas a cada três passos quando se aproximam do limite de contexto. Cada compressão reescreve o prefixo, forçando o modelo a reprocessar toda a janela de contexto desde o início. O trabalho em cache transforma-se em desperdício absoluto.
O efeito combinado empurrou todas as pesquisas para o custo máximo, convertendo qualquer pessoa num utilizador extremo, independentemente da sua intensidade de uso real. O caso mais impressionante revelado aponta para um subscritor do plano Max, que pagava cerca de 95 euros por mês, mas que gerou mais de 5200 euros em custos equivalentes de API num único ciclo de faturação. Esta diferença brutal forçou a empresa a agir, cortando o acesso via subscrição e obrigando estas ferramentas a usar a faturação padrão da API. A curto prazo, os custos para quem usa estes agentes vão disparar, mas a pressão financeira será o motor necessário para forçar os programadores a otimizar a gestão de contexto e a parar de queimar recursos de forma insustentável.












Nenhum comentário
Seja o primeiro!