Post
A Anthropic Trocou o Cérebro do Claude — Veja o Que Mudou por Dentro
O Claude Opus 4.7 chegou com um system prompt reescrito, e como a Anthropic realmente publica esse tipo de coisa, dá pra ler o diff. As partes chatas são as mais reveladoras.
Olha, tem uma coisa que a maioria das pessoas não percebe: quando um laboratório de IA lança um modelo novo, eles também lançam em silêncio uma parede de texto enorme dizendo pro modelo como se comportar. O modelo é o carro. O system prompt é o manual colado no painel.
Quase ninguém publica esse manual. A Anthropic publica. E na semana passada, quando o Claude Opus 4.7 substituiu o 4.6, eles atualizaram o manual — e o Simon Willison fez a arqueologia pra contar exatamente o que mudou.
É uma leitura ótima porque as partes chatas são as mais reveladoras.
Por que você deveria se importar com um system prompt
Pense no modelo como um funcionário brilhante no primeiro dia. Inteligente, capaz, cheio de potencial — e sem nenhum contexto da empresa, dos usuários ou do que é aceitável. O system prompt é o treinamento de integração.
Quando ele muda, você tá vendo uma empresa renegociar o contrato com o próprio modelo. O que ele deve recusar? O que ele deve simplesmente fazer? Com que voz ele deve falar?
Pro Claude em específico, a Anthropic publica esse manual — Opus 4.7, Sonnet 4.6, Haiku 4.5, as versões antigas do Opus, tudo. Isso é raro. A OpenAI não publica. O Google não publica. É um daqueles gestos de transparência pequenos, mas reais.
O que realmente mudou no 4.7
O Simon Willison analisou o diff e os destaques são genuinamente interessantes. Deixa eu agrupar por tema, porque o padrão é mais útil que as linhas isoladas.
Tema 1: Menos perguntar, mais fazer
| Antes (4.6) | Depois (4.7) |
|---|---|
| Fazer perguntas de esclarecimento quando o pedido é ambíguo | Fazer uma tentativa razoável agora se os detalhes não foram especificados |
| Resistir quando o usuário tenta encerrar a conversa | Respeitar o "tá bom, chega" e parar |
| Sem mecanismo de busca de ferramentas | Novo fluxo de busca de ferramentas pra resolver ambiguidade sem incomodar o usuário |
A mudança é: pare de ser um burocrata educado. Se dá pra adivinhar o que o usuário quis dizer, só faça. Se ele disse tchau, acredite.
É uma virada filosófica silenciosa mas grande. O Claude anterior tinha o hábito nítido de fazer três perguntas antes de responder uma. O 4.7 tá sendo mandado parar com isso.
Tema 2: Mais rígido em segurança infantil
Uma seção inteira expandida agora vive dentro de tags <critical_child_safety_instructions>. A linha notável é:
Uma vez que o Claude recusar um pedido por razões de segurança infantil, todos os pedidos subsequentes na mesma conversa devem ser abordados com cautela extrema.
Tradução: se você cruzou a linha uma vez, o resto da conversa fica sob lupa. Não adianta tentar passar despercebido na segunda.
Também tem nova linguagem explícita sobre transtornos alimentares e sobre "ataques de screenshot sim/não" — onde alguém tenta tirar uma resposta de uma palavra só sobre um tema político polêmico, tira print fora de contexto e usa como arma. O Claude agora é instruído a não entrar nesse jogo.
Tema 3: O fantasma dos velhos tiques
Essa é a minha favorita, porque ela conta como o próprio modelo mudou.
O prompt do 4.6 tinha instruções explícitas tipo "não use ações entre asteriscos" e "evite dizer 'genuinamente' ou 'honestamente'". O prompt do 4.7 remove essas linhas.
Você não remove uma instrução porque parou de se importar. Você remove porque o comportamento sumiu. Em algum ponto do treinamento, o 4.7 deixou de precisar ser lembrado pra não encher a resposta de honestamente, eu genuinamente acho que....
Esse é o sinal interessante. O system prompt não é só um manual — é um espelho do que o modelo erra por padrão. Quando uma linha some do prompt, significa que o treinamento corrigiu o comportamento na raiz.
Tema 4: Coisa de produto
Pequeno, mas vale notar:
- "Developer platform" virou "Claude Platform" — um aperto de branding
- Ferramentas novas: um agente de slides, então o Claude agora consegue rascunhar apresentações do PowerPoint
- Esclarecimento sobre a presidência Trump foi removido, refletindo o knowledge cutoff atualizado pra janeiro de 2026
Nenhuma dramática. É só o sedimento de um produto que ainda tá se movendo rápido.
Por que a Anthropic publica isso
Aqui eu quero dar crédito de verdade, porque é uma escolha.
Todo laboratório tem um system prompt. O modelo de todo laboratório é moldado por centenas de linhas de instruções que o usuário nunca vê. Publicar isso te expõe exatamente ao tipo de escrutínio que o Simon fez: alguém pode diffar seus prompts e narrar em voz alta o que você tá fazendo diferente.
A maioria das empresas odiaria isso. A Anthropic abraça, e eu acho que a aposta é: se a nossa história de segurança é real, ter as pessoas lendo o nosso dever de casa é um ativo, não um passivo.
Funciona? Em geral, sim. O diff conta uma história coerente — menos atrito pra usuários legítimos, mais atrito pros mal-intencionados, menos tiques, mesmos valores de fundo. Você não precisa acreditar no marketing. Dá pra só ler.
O contra-argumento honesto é que o prompt publicado não é necessariamente o prompt real rodando em tempo de inferência. Não tem prova criptográfica. Mas como mais ninguém tá nem oferecendo o texto, "confie mas verifique" é melhor que "confia na gente".
O que eu tiro disso
Três coisas.
Uma: a direção das mudanças é sã. Menos pergunta desnecessária, mais rígido no que importa de verdade (segurança infantil, tentativa de manipulação), mais frouxo no que só irritava (recusa de emoji, polícia de palavras-muleta).
Duas: leia os system prompts quando os laboratórios publicam. Eles te contam mais sobre como um modelo realmente é do que qualquer nota de benchmark. Benchmark mede capacidade. System prompt revela filosofia.
Três: as linhas removidas é onde tá a história. Uma instrução que desaparece é um comportamento que o treinamento consertou. Isso é uma barra de progresso melhor que qualquer número de versão.
A gente nunca vai ter esse nível de detalhe de todo laboratório. Mas toda vez que a Anthropic lançar um diff novo, eu vou continuar lendo. O manual de integração é onde mora a alma.
Fontes
- Simon Willison — Changes in the system prompt between Claude Opus 4.6 and 4.7 — o texto detalhado mudança a mudança que originou este post
- Simon Willison — Claude system prompts as a git timeline — a ferramenta baseada em git que ele construiu pra diffar versões do prompt
- Anthropic — Release notes dos system prompts do Claude — os prompts oficiais publicados de todo modelo Claude atual
- GitHub — simonw/research/extract-system-prompts — o repositório com a versão em histórico git dos prompts