Post
O Claude Agora Sonha — E a Anthropic Pulou o Update de Modelo
No Code w/ Claude 2026, a Anthropic lançou uma plataforma inteira de agentes — consolidação de memória, orquestração multi-agente, code review automático — mas nenhum modelo novo. Isso é um sinal deliberado.
Então a Anthropic fez seu grande evento de desenvolvedores ontem — Code w/ Claude 2026 — e a coisa mais surpreendente não foi o que anunciaram.
Foi o que não anunciaram.
Sem novo modelo Claude. Sem "Sonnet 4.7 Thinking." Sem slide-teaser do próximo. A CPO Ami Vora falou em alto e bom som no keynote: "Hoje é sobre como estamos fazendo nossos produtos funcionarem melhor pra você." Tradução educada: hoje a gente não tá correndo atrás de benchmark. A gente tá entregando o trivial que faz agente realmente funcionar.
E o trivial está genuinamente interessante.
O que de fato lançaram
Aqui o pacote, agrupado mais ou menos:
| Área | Feature | O que faz |
|---|---|---|
| Memória | Dreaming | Agentes revisam sessões passadas durante a noite, acham padrões, consolidam memória |
| Objetivos | Outcomes | Critérios de sucesso declarativos — agentes iteram até bater a meta |
| Coordenação | Multi-agent orchestration | Agente líder quebra tarefas e delega para sub-agentes |
| Claude Code | Code Review, CI auto-fix, Security Reviews | Revisores e fixers automáticos plugados em PRs |
| Claude Code | Remote Agents | Controle o agente do seu laptop pelo celular |
| Claude Code | Routines | Prompts de mais alto nível para automação assíncrona |
| Superfície | Claude Desktop App | GUI fullscreen com preview web ao vivo, multi-sessão |
| Compute | Acordo SpaceX Colossus 1 | 300MW / 220 mil GPUs NVIDIA, limites de 5h dobrados |
É muito produto. Nada disso é um modelo novo.
A feature-bomba: o Claude consegue sonhar
De tudo isso, Dreaming foi a que me fez parar e reler a página.
A ideia é a seguinte. Enquanto seu agente trabalha, ele roda num loop apertado — lê contexto, planeja, age, observa, repete. Não tem tempo de dar um passo atrás e pensar "espera, eu cometo o mesmo erro toda terça." Ele tá ocupado.
Dreaming é um processo agendado em que o agente — quando ninguém tá olhando — volta nas sessões passadas e no banco de memória dele e faz aquilo que humanos fazem quando dormem:
- Funde duplicatas ("Tenho três notas dizendo a mesma coisa")
- Limpa entradas obsoletas ("Essa config mudou faz duas semanas, joga fora a antiga")
- Resolve contradições ("Essas duas memórias se contradizem, aqui o resultado")
- Faz emergir padrões ("Continuo errando isso da mesma forma")
O enquadramento da Anthropic é direto: "Dreaming faz emergir padrões que um agente sozinho não consegue ver, incluindo erros recorrentes, fluxos para onde agentes convergem e preferências compartilhadas por um time."
A metáfora cola porque rastreia a neurociência de verdade. Sono REM não é decorativo — é quando humanos consolidam as experiências do dia em memória de longo prazo e podam o ruído. A gente vinha correndo em dois eixos: treinamento (pesos mais espertos) e inferência (respostas mais espertas por query). Dreaming é um terceiro eixo — consolidação entre sessões. Um loop lento por baixo do loop rápido.
Se vai funcionar como anunciado é outra história. Tá em research preview no momento — você precisa pedir acesso. Mas conceitualmente, é a primeira feature que vejo de um lab de fronteira tratando agentes de longa duração como organismos em vez de funções stateless.
Por que entregar isso e não um modelo novo?
Algumas leituras possíveis, em ordem crescente de quão interessantes são:
Leitura 1: Não tinham um pronto. Possível. Sempre possível. Chato.
Leitura 2: Ganhos de modelo estão ficando caros e pouco espetaculares. Cada geração custa mais e entrega "uauzinhos" menores pro usuário final. O delta visível entre "Sonnet atual" e "próximo Sonnet" é real mas estreito. O delta entre "Claude Code sem auto-fix" e "Claude Code que conserta o próprio PR quebrado às 3 da manhã" é gigante.
Leitura 3: O fosso se mexeu. Modelos estão virando commodity. Três labs lançam modelos de fronteira aproximadamente comparáveis num intervalo de meses. O que não está virando commodity — ainda — é a camada acima: memória, orquestração, integração com seu código e seus tickets e sua infra de verdade. É aí que mora o lock-in. A Anthropic está correndo na camada que é mais difícil de copiar.
Eu fico com a leitura 3. Ela também explica o acordo com SpaceX (300MW de novo compute) e os rate limits dobrados — não estão estocando pra um lançamento de modelo, estão estocando porque agentes são mais pesados que chats. Uma única sessão de agente com Outcomes, retries e sub-agentes queima ordens de magnitude mais tokens do que um prompt one-shot. Se a estratégia é "agentes em todo lugar", a conta segue junto.
O outro lado
Cabe dar a fala ao contraditório.
Dá pra argumentar que isso é o que labs de modelo fazem entre releases — empacotam encanamento como "plataforma" pra preencher o ciclo de notícias. E tem uma verdade aí. Várias dessas features (Code Review, Security Reviews, Remote Agents) são jogadas pra correr atrás dos workflows autônomos do GitHub Copilot e dos background agents do Cursor.
Dá pra argumentar também que Dreaming é arriscado. O desconforto do Simon Willison sobre não revisar cada linha de código gerado por agente já se aplica a sessões curtas. Um agente que reescreve a própria memória enquanto você dorme, e depois toma decisões baseadas nessa reescrita, é mais difícil de auditar. A Anthropic oferece um modo "revisar mudanças antes de gravar" — mas se dreaming virar padrão, quem revisa de verdade?
São preocupações legítimas. E é por isso que a feature está gated em research preview e não ligada por padrão.
Minha opinião
A leitura honesta: esse foi o keynote mais confiante que a Anthropic fez.
Confiante porque pular um lançamento de modelo no seu evento principal de desenvolvedores exige peito. Confiante porque as features que entregaram — especialmente Dreaming — são apostas num horizonte mais longo que o próximo ciclo de benchmark. Estão dizendo: a gente acha que o próximo salto está em infraestrutura de agente, não num pulinho de 0.5 no MMLU.
Acho que estão certos. Os times que vejo tirando valor real do Claude não são os que atualizaram pro último checkpoint semana passada. São os que descobriram como dar pro agente uma memória estável, um critério de sucesso claro e a capacidade de rodar sozinho durante a madrugada.
A Anthropic acabou de entregar os três.
O veredito do "amigo nerd": se você tá construindo com Claude, peça acesso ao preview do dreaming. Se ainda não tá construindo com Claude, essa é uma semana razoável pra começar.
Sources
- Higher usage limits for Claude and a compute deal with SpaceX — Anúncio oficial da Anthropic cobrindo o acordo SpaceX Colossus 1 e os rate limits dobrados do Claude Code
- Live blog: Code w/ Claude 2026 — Notas ao vivo do Simon Willison do keynote, incluindo citações diretas da Ami Vora e o roundup completo de features
- Anthropic will let its managed agents dream — Cobertura do The New Stack sobre Dreaming, Outcomes e Multi-agent orchestration com o enquadramento da própria Anthropic
- Anthropic is letting Claude agents 'dream' so they don't sleep on the job — Análise mais aprofundada da SiliconANGLE sobre a feature de Dreaming
- Vibe coding and agentic engineering are getting closer than I'd like — Simon Willison sobre o desconforto de confiar em output de agente sem revisão, relevante pro argumento de risco do Dreaming