Hive Report: GPT-5.5, DeepSeek V4 e a Semana de US$ 100 Bilhões na IA

Foi aquela semana em que você abre o leitor de RSS e fecha imediatamente porque já está atrasado. Dois novos modelos de fronteira. Dois megadeals acima de US$ 40 bilhões. TPUs novas. Geração de imagem nova. Demissões em massa. Software de vigilância. E um patch da Apple que fechou silenciosamente uma porta lateral usada pelo FBI.

Se você anda acompanhando, já cobrimos a Qwen encolhendo o modelo e o postmortem do Claude Code que não foi um nerf. Então hoje vamos pegar tudo o mais que aconteceu — e foi bastante.

Destaques da Semana

Google vai investir até US$ 40 bilhões na Anthropic. O acordo é dividido: US$ 10 bilhões em caixa agora, com valuation de US$ 350 bilhões, mais US$ 30 bilhões atrelados a metas de performance. A Anthropic ainda recebe 5 gigawatts de capacidade de TPU ao longo de cinco anos. Isso vem dias depois da Amazon ter se comprometido com até US$ 25 bilhões. A receita anualizada da Anthropic já passou de US$ 30 bilhões, contra US$ 9 bilhões em dezembro. O Google agora tem cerca de 14% da empresa. (TechCrunch)

SpaceX fecha opção de US$ 60 bilhões para comprar a Cursor. A Cursor estava prestes a fechar uma rodada de US$ 2 bilhões. A SpaceX entrou, ofereceu US$ 10 bilhões como "taxa de colaboração" mínima e uma opção de adquirir a empresa inteira por US$ 60 bilhões ainda este ano, e a Cursor pausou a rodada. O plano é juntar a distribuição da IDE da Cursor com o cluster Colossus da SpaceX, equivalente a "um milhão de H100s". A aquisição está marcada para depois do IPO da SpaceX neste verão. Sim, você leu certo — a SpaceX está fazendo IPO e comprando uma ferramenta de IA pra programar. (CNBC)

Chegaram as TPUs de 8ª geração do Google: 8t pra treino, 8i pra inferência. A TPU 8t escala até 9.600 chips por pod, entrega 121 ExaFlops e diz ter quase 3x o compute por pod da geração anterior. A TPU 8i é a irmã de inferência: 288GB de HBM, latência 5x menor através de um novo Collectives Acceleration Engine, e 80% mais performance por dólar. Ambas rodam com o dobro da eficiência energética da Ironwood. Disponibilidade geral mais pra frente em 2026. (Blog do Google)

ChatGPT Images 2.0 chegou e o Sam Altman compara com "GPT-3 pra GPT-5". O novo modelo de imagem da OpenAI lida com cenas complexas de múltiplos elementos, acerta texto dentro de imagens na maior parte das vezes, e empurra a resolução pra 3840×2160. O teste do pelicano numa bicicleta do Simon Willison se manteve — embora o modelo ainda alucine objetos que ele mesmo não desenhou. Disponível pra usuários do ChatGPT hoje, acesso via API com gpt-image-2. (OpenAI)

Meta corta 8.000 vagas — e começa a registrar movimentos do mouse dos funcionários. Duas histórias, uma empresa, uma semana. As demissões começam em 20 de maio (10% do quadro, mais 6.000 vagas abertas que serão fechadas) sob o programa "Agent Transformation Accelerator". Em paralelo, a Meta está lançando o "Model Capability Initiative" — software que captura cliques, teclas digitadas e capturas de tela ocasionais nos computadores de trabalho dos funcionários nos EUA. A justificativa: dados de treino pra agentes de IA que vão usar software corporativo de forma autônoma. O clima: distópico. (Bloomberg, Reuters)

Apple fecha a porta lateral do FBI nas notificações do iPhone. Lembra do truque do FBI com o Signal de duas semanas atrás? A Apple acabou de soltar o patch. O iOS estava cacheando o conteúdo das notificações — incluindo texto de mensagens com timer de auto-destruição — por até um mês, mesmo depois de apagadas. A correção está sendo distribuída e foi backportada pra dispositivos com iOS 18 mais antigos. O presidente do Signal foi direto: notificações de mensagens apagadas não deveriam ficar em nenhum banco de dados do SO. Resposta certa, patch atrasado. (TechCrunch)

Bitwarden CLI comprometida em ataque de supply chain. A Socket detectou um pacote malicioso se passando pela CLI do Bitwarden, parte de uma campanha em andamento que já atingiu Checkmarx e outros. Se você instala ferramentas de dev via npm ou registries similares, hoje é um bom dia pra auditar. Ataques de supply chain não são uma história de 2024 — são uma história de agora. (Socket)

Deep Dive: GPT-5.5 vs DeepSeek V4 — Quem Está Pagando pela Fronteira?

Mesma semana. Dois lançamentos de modelos de fronteira. Economias quase espelhadas. Se você quisesse um único gráfico pra resumir o estado da IA em abril de 2026, é esse aqui.

O cenário

Na quarta-feira, a OpenAI lançou o GPT-5.5. Na sexta, a DeepSeek lançou o V4. Os dois reivindicam performance de fronteira. Um foi lançado pelo dobro do preço do antecessor. O outro foi lançado por uma fração.

Vamos colocar os números lado a lado.

Modelo	Input (US$/M tokens)	Output (US$/M tokens)	Notas
GPT-5.5	US$ 5,00	US$ 30,00	2x o preço do GPT-5.4
GPT-5.5 Pro	US$ 30,00	US$ 180,00	Tier de raciocínio estendido
GPT-5.4 (ainda disponível)	US$ 2,50	US$ 15,00	Agora posicionado como tier econômico
DeepSeek V4-Pro	US$ 1,74	US$ 3,48	1,6T de parâmetros MoE, 49B ativos
DeepSeek V4-Flash	US$ 0,14	US$ 0,28	284B MoE, 13B ativos
Claude Opus 4.7 (referência)	US$ 5,00	US$ 25,00	Mesmo input do GPT-5.5

Releia a linha do V4-Pro. US$ 1,74 input, US$ 3,48 output. Pra um modelo que o próprio paper do V4 admite estar atrás da fronteira absoluta por talvez três a seis meses. Isso é mais ou menos 1/3 do preço do GPT-5.5 e 1/14 do GPT-5.5 Pro no output.

O que mudou na OpenAI

O GPT-5.5 não é só um upgrade pequeno. Os reviewers descrevem ele como "rápido, eficaz, altamente capaz" com um perfil mais afiado de seguir instruções. A novidade principal é o raciocínio estendido: passe reasoning_effort: xhigh e o modelo queima milhares de tokens de raciocínio antes de responder — os testes do Simon Willison mostraram 9.322 tokens de raciocínio contra 39 no modo padrão pro mesmo prompt.

O padrão de "fronteira irregular" continua — forte em algumas áreas, surpreendentemente fraco em outras — mas a direção geral é clara. A OpenAI tá disposta a trocar custo por capacidade, e tá apostando que os clientes vão pagar.

O que mudou na DeepSeek

O V4 também é mais que um update incremental. Os números de destaque são sobre eficiência, não só qualidade. Pra um contexto de 1 milhão de tokens, o V4-Pro usa 27% dos FLOPs por token do V3.2 e 10% do tamanho do KV cache. O V4-Flash vai além: 10% dos FLOPs e 7% do KV cache.

Isso não é corte de custo. É reescrita de arquitetura. Eles descobriram como fazer mais com muito, muito menos compute, e passaram a economia adiante.

O padrão

Existem agora duas fronteiras distintas:

A fronteira fechada, onde OpenAI, Anthropic e Google cobram US$ 5 a US$ 30 por milhão de tokens pelos melhores modelos, recebem bilhões em capex das Big Techs, e lançam features como raciocínio estendido que exigem orçamentos obscenos de compute.
A fronteira aberta(-ish), onde DeepSeek, Qwen e um pequeno punhado de outros lançam algo quase tão bom, por 10–20% do preço, com pesos que você pode baixar.

A diferença em capacidade tá diminuindo. A diferença em preço tá aumentando. Três a seis meses de atraso no modelo agora compram uma ordem de grandeza em custo.

Quem paga pelo quê

É aqui que fica interessante. Os labs fechados estão financiando a próxima rodada com injeções massivas de capital — exatamente os deals que cobrimos acima. A Anthropic acabou de pegar US$ 40B do Google em cima dos US$ 25B da Amazon. A SpaceX tá pagando US$ 60B por uma IDE. A OpenAI tem seus próprios deals circulares de compute empilhados mais alto do que dá pra desenhar.

Enquanto isso a DeepSeek... lança um paper, um modelo e uma tabela de preços, e vai embora.

A fronteira fechada tá cada vez mais financiada por hyperscalers que precisam de algum lugar pra colocar a capacidade de TPU e GPU deles. A fronteira aberta é financiada por eficiência. As duas coisas podem ser verdade. Mas isso significa que a pergunta "o GPT-5.5 vale 2x o GPT-5.4?" agora divide o palco com "...e 17x o DeepSeek V4-Pro?"

Minha visão

Acho que os próximos 12 meses se resumem a saber se os labs fechados conseguem manter a diferença em capacidade larga o suficiente pra justificar a diferença em preço. Raciocínio estendido ajuda a OpenAI aqui — é uma feature genuinamente difícil de clonar, e come compute que os labs abertos não têm.

Mas "quase tão bom" é um competidor mortal. Não pro ChatGPT (consumidor vai pagar pelo melhor), mas pro mercado dev, onde uma diferença de 30% em performance importa menos que uma diferença de 10x em custo quando você tá rodando milhões de chamadas de API.

Se eu fosse a OpenAI ou a Anthropic, o gráfico que me preocuparia não seria o de leaderboard. Seria o de preço por token, plotado ao longo do tempo, com a linha da DeepSeek caindo mais rápido que a minha. A fronteira não é mais onde tá o dinheiro. A fronteira é onde tá o prestígio. O dinheiro tá no que for usado em produção.

Os US$ 100 bilhões em deal flow dessa semana são a fronteira fechada captando os fundos que ela precisa pra ficar na frente. O V4 é a fronteira aberta dizendo que não precisa de tanto dinheiro pra acompanhar. Vamos ver quem tá certo.

Fontes

Introducing GPT-5.5 — anúncio oficial de lançamento da OpenAI
GPT-5.5 via the semi-official Codex backdoor API — review prático e tabela de preços do Simon Willison
DeepSeek V4 — almost on the frontier, a fraction of the price — análise do Simon com benchmarks e comparação de preços
Google to invest up to $40B in Anthropic in cash and compute — cobertura da TechCrunch sobre o megadeal Google–Anthropic
SpaceX says it can buy Cursor for $60 billion — CNBC sobre a opção SpaceX–Cursor
Our eighth generation TPUs: two chips for the agentic era — anúncio do Google sobre TPU 8t/8i
Introducing ChatGPT Images 2.0 — lançamento do modelo de imagem da OpenAI
Meta tells staff it will cut 10% of jobs — Bloomberg sobre as demissões da Meta
Meta to start capturing employee mouse movements and keystrokes for AI training — Reuters sobre o Model Capability Initiative
Apple fixes bug that cops used to extract deleted chat messages from iPhones — TechCrunch sobre o patch do iOS
Bitwarden CLI compromised in ongoing Checkmarx supply chain campaign — análise da Socket sobre o ataque de supply chain