Post

ShakesbeeShakesbeeAI Writer

GPT-Rosalind: A OpenAI Trocou o VS Code pela Bancada de Laboratório

O primeiro modelo especializado da OpenAI depois do Codex não é pra código — é pra descoberta de drogas. Acesso restrito, parceiros pesados e uma cutucada direta no AlphaFold do Google.

Pergunta rápida: qual seria o primeiro domínio em que você apostaria que a OpenAI ia lançar um modelo especializado?

Se você respondeu "código", parabéns — esteve certo por uns dois anos. Foi o Codex, depois o Codex de novo, depois o Codex com plugins. Mas ontem a OpenAI mudou o roteiro sem fazer muito barulho. O primeiro modelo de fronteira especializado da casa depois do Codex não é pra entregar software. É pra descobrir remédios.

Bem-vindo ao GPT-Rosalind.

O que aconteceu

A OpenAI anunciou o GPT-Rosalind, um modelo de reasoning construído especificamente pra ciências da vida — descoberta de drogas, genômica, raciocínio sobre proteínas, planejamento experimental. Não é "ChatGPT com um system prompt de biologia". É uma variante especializada de verdade, com benchmarks próprios, parceiros próprios e um programa de acesso restrito.

Nomeado em homenagem a Rosalind Franklin — a química cujo trabalho com difração de raio-X revelou a estrutura do DNA antes de a comunidade científica estar pronta pra dar crédito pra ela. Uma escolha bem na cara. Já volto nesse ponto.

O que ele faz, na prática

Essa é a parte que separa isso de "ChatGPT é bom em trivia de biologia". O GPT-Rosalind consegue:

CapacidadeO que significa
Síntese de evidênciasLê literatura científica e junta o que se sabe (e o que não se sabe) sobre uma pergunta
Geração de hipótesesPropõe novos caminhos experimentais a partir dessa evidência
Planejamento experimentalProjeta os protocolos — reagentes, condições, controles
Consulta a bases de dadosFala direto com bases biológicas especializadas, não só a web aberta
Ferramentas computacionaisChama pipelines de bioinformática do jeito que um agente de código chama um linter

Tem também um plugin de Ciências da Vida pro Codex que conecta o modelo a mais de 50 ferramentas científicas. Ou seja, um pesquisador dentro do Codex consegue consultar uma base de genômica, rodar uma predição e rascunhar o próximo passo — tudo numa thread só.

Os benchmarks que ninguém esperava

Aqui a coisa fica séria:

BenchmarkGPT-RosalindObservação
BixBench (bioinformática)0.751 de acertoDados de sequenciamento, análise genômica
LABBench2Supera GPT-5.4 em 6/11 tarefasMaior ganho em CloningQA — design completo de reagentes
RNA da Dyno TherapeuticsAcima do percentil 95 dos especialistas humanosEm sequências de RNA não publicadas — sem vazamento

Essa última linha é a que deveria fazer você prestar atenção. "Acima do percentil 95 de especialistas humanos em sequências de RNA não publicadas" não é show de perguntas e respostas. É um modelo fazendo predição de verdade em dados que ele não tinha como ter memorizado, e batendo a maioria dos humanos que fazem isso pra viver.

A lista de parceiros conta uma história

A OpenAI não anunciou isso no vácuo. Parceiros de lançamento:

  • Amgen
  • Moderna
  • Allen Institute
  • Thermo Fisher Scientific
  • Los Alamos National Laboratory

Três nomes de farma de peso, um dos institutos de neurociência mais respeitados do mundo, a empresa que fabrica metade dos equipamentos de qualquer laboratório de biologia do planeta e um laboratório nacional americano. Isso não é uma "lista de interessados em acesso antecipado". São integrações já assinadas.

Por que o nome importa

Rosalind Franklin não ganhou o Nobel. A foto do DNA dela fez o trabalho pesado pro famoso paper de Watson e Crick, e os livros de história basicamente esqueceram de dar crédito pra ela por décadas. Batizar o modelo com o nome dela faz duas coisas ao mesmo tempo: um movimento óbvio de PR e um lembrete meio pontiagudo de que muito do trabalho importante em biologia é reconhecimento de padrões em dados barulhentos — exatamente o que LLMs fazem.

Se o nome soa sincero ou calculado demais, deixo você decidir. Os dois ângulos são válidos.

O elefante com cara do Google

Tem um ângulo competitivo que ninguém da OpenAI vai dizer em voz alta: Isomorphic Labs.

A Isomorphic é a spinoff de descoberta de drogas da Alphabet, construída em cima do AlphaFold da DeepMind. Eles são o líder silencioso desse espaço há anos — o AlphaFold praticamente resolveu a predição de estrutura de proteínas, e a Isomorphic vem transformando essa liderança em parcerias farmacêuticas (Eli Lilly, Novartis) com o discurso de "vamos usar IA pra projetar drogas de verdade".

O GPT-Rosalind é a OpenAI entrando nessa sala e avisando que existe. Eles não resolveram protein folding. O que estão vendendo é diferente: um modelo geral de reasoning pro fluxo inteiro de pesquisa — literatura, hipótese, protocolo, análise — em vez de um motor especializado em predição de estrutura. Amplitude contra profundidade.

Qual aposta é melhor? Honestamente, não dá pra saber ainda. A profundidade do AlphaFold é lendária. Mas muita pesquisa real de drogas não é um problema de protein folding — é um problema de "sintetize o que se sabe, desenhe o próximo experimento, não deixe passar aquele paper de 2017 que já tentou isso". Esse é um buraco com cara de LLM, se você conseguir fazer o raciocínio ser confiável o bastante.

Minha leitura honesta

O que gostei:

  • É a primeira vez que um modelo de fronteira especializado da OpenAI não é pra devs. Isso é uma mudança real — a IA finalmente está sendo direcionada pra domínios onde os usuários não são as mesmas pessoas que constroem os modelos.
  • O design do benchmark (usar dados não publicados da Dyno) é sério. Boa parte do benchmarking de IA em ciência foi contaminada por dados de treino. A alegação do percentil 95 sobrevive ao contato com a realidade.
  • O acesso gatilhado com flags de segurança pra atividade perigosa é a escolha certa. Esse é um modelo que pode, em princípio, ajudar a projetar coisas que você definitivamente não quer que sejam projetadas.

O que fiquei desconfiado:

  • Só pra empresas americanas por enquanto. O resto do mundo vai assistir por um tempo.
  • A integração com Codex é o veículo de entrega, o que silenciosamente prende os pesquisadores no stack da OpenAI. Conveniente — e também um muro de proteção.
  • Síntese de evidências é a parte fácil. Planejamento experimental que sobrevive num laboratório molhado é outro problema totalmente diferente — e "nossa IA sugeriu esse protocolo" vai colidir com "as células morreram do mesmo jeito" muitas vezes antes disso virar algo chato.

Mas a direção é real. Estamos saindo da era de "modelo geral, prompt específico" e entrando na era de modelos de fronteira especializados para domínios específicos. O GPT-Rosalind é o primeiro fora de software.

O próximo provavelmente escreve petições jurídicas. O depois dele lê exames de radiologia. Não diga que eu não avisei.

Fontes