Post
GPT-Rosalind: A OpenAI Trocou o VS Code pela Bancada de Laboratório
O primeiro modelo especializado da OpenAI depois do Codex não é pra código — é pra descoberta de drogas. Acesso restrito, parceiros pesados e uma cutucada direta no AlphaFold do Google.
Pergunta rápida: qual seria o primeiro domínio em que você apostaria que a OpenAI ia lançar um modelo especializado?
Se você respondeu "código", parabéns — esteve certo por uns dois anos. Foi o Codex, depois o Codex de novo, depois o Codex com plugins. Mas ontem a OpenAI mudou o roteiro sem fazer muito barulho. O primeiro modelo de fronteira especializado da casa depois do Codex não é pra entregar software. É pra descobrir remédios.
Bem-vindo ao GPT-Rosalind.
O que aconteceu
A OpenAI anunciou o GPT-Rosalind, um modelo de reasoning construído especificamente pra ciências da vida — descoberta de drogas, genômica, raciocínio sobre proteínas, planejamento experimental. Não é "ChatGPT com um system prompt de biologia". É uma variante especializada de verdade, com benchmarks próprios, parceiros próprios e um programa de acesso restrito.
Nomeado em homenagem a Rosalind Franklin — a química cujo trabalho com difração de raio-X revelou a estrutura do DNA antes de a comunidade científica estar pronta pra dar crédito pra ela. Uma escolha bem na cara. Já volto nesse ponto.
O que ele faz, na prática
Essa é a parte que separa isso de "ChatGPT é bom em trivia de biologia". O GPT-Rosalind consegue:
| Capacidade | O que significa |
|---|---|
| Síntese de evidências | Lê literatura científica e junta o que se sabe (e o que não se sabe) sobre uma pergunta |
| Geração de hipóteses | Propõe novos caminhos experimentais a partir dessa evidência |
| Planejamento experimental | Projeta os protocolos — reagentes, condições, controles |
| Consulta a bases de dados | Fala direto com bases biológicas especializadas, não só a web aberta |
| Ferramentas computacionais | Chama pipelines de bioinformática do jeito que um agente de código chama um linter |
Tem também um plugin de Ciências da Vida pro Codex que conecta o modelo a mais de 50 ferramentas científicas. Ou seja, um pesquisador dentro do Codex consegue consultar uma base de genômica, rodar uma predição e rascunhar o próximo passo — tudo numa thread só.
Os benchmarks que ninguém esperava
Aqui a coisa fica séria:
| Benchmark | GPT-Rosalind | Observação |
|---|---|---|
| BixBench (bioinformática) | 0.751 de acerto | Dados de sequenciamento, análise genômica |
| LABBench2 | Supera GPT-5.4 em 6/11 tarefas | Maior ganho em CloningQA — design completo de reagentes |
| RNA da Dyno Therapeutics | Acima do percentil 95 dos especialistas humanos | Em sequências de RNA não publicadas — sem vazamento |
Essa última linha é a que deveria fazer você prestar atenção. "Acima do percentil 95 de especialistas humanos em sequências de RNA não publicadas" não é show de perguntas e respostas. É um modelo fazendo predição de verdade em dados que ele não tinha como ter memorizado, e batendo a maioria dos humanos que fazem isso pra viver.
A lista de parceiros conta uma história
A OpenAI não anunciou isso no vácuo. Parceiros de lançamento:
- Amgen
- Moderna
- Allen Institute
- Thermo Fisher Scientific
- Los Alamos National Laboratory
Três nomes de farma de peso, um dos institutos de neurociência mais respeitados do mundo, a empresa que fabrica metade dos equipamentos de qualquer laboratório de biologia do planeta e um laboratório nacional americano. Isso não é uma "lista de interessados em acesso antecipado". São integrações já assinadas.
Por que o nome importa
Rosalind Franklin não ganhou o Nobel. A foto do DNA dela fez o trabalho pesado pro famoso paper de Watson e Crick, e os livros de história basicamente esqueceram de dar crédito pra ela por décadas. Batizar o modelo com o nome dela faz duas coisas ao mesmo tempo: um movimento óbvio de PR e um lembrete meio pontiagudo de que muito do trabalho importante em biologia é reconhecimento de padrões em dados barulhentos — exatamente o que LLMs fazem.
Se o nome soa sincero ou calculado demais, deixo você decidir. Os dois ângulos são válidos.
O elefante com cara do Google
Tem um ângulo competitivo que ninguém da OpenAI vai dizer em voz alta: Isomorphic Labs.
A Isomorphic é a spinoff de descoberta de drogas da Alphabet, construída em cima do AlphaFold da DeepMind. Eles são o líder silencioso desse espaço há anos — o AlphaFold praticamente resolveu a predição de estrutura de proteínas, e a Isomorphic vem transformando essa liderança em parcerias farmacêuticas (Eli Lilly, Novartis) com o discurso de "vamos usar IA pra projetar drogas de verdade".
O GPT-Rosalind é a OpenAI entrando nessa sala e avisando que existe. Eles não resolveram protein folding. O que estão vendendo é diferente: um modelo geral de reasoning pro fluxo inteiro de pesquisa — literatura, hipótese, protocolo, análise — em vez de um motor especializado em predição de estrutura. Amplitude contra profundidade.
Qual aposta é melhor? Honestamente, não dá pra saber ainda. A profundidade do AlphaFold é lendária. Mas muita pesquisa real de drogas não é um problema de protein folding — é um problema de "sintetize o que se sabe, desenhe o próximo experimento, não deixe passar aquele paper de 2017 que já tentou isso". Esse é um buraco com cara de LLM, se você conseguir fazer o raciocínio ser confiável o bastante.
Minha leitura honesta
O que gostei:
- É a primeira vez que um modelo de fronteira especializado da OpenAI não é pra devs. Isso é uma mudança real — a IA finalmente está sendo direcionada pra domínios onde os usuários não são as mesmas pessoas que constroem os modelos.
- O design do benchmark (usar dados não publicados da Dyno) é sério. Boa parte do benchmarking de IA em ciência foi contaminada por dados de treino. A alegação do percentil 95 sobrevive ao contato com a realidade.
- O acesso gatilhado com flags de segurança pra atividade perigosa é a escolha certa. Esse é um modelo que pode, em princípio, ajudar a projetar coisas que você definitivamente não quer que sejam projetadas.
O que fiquei desconfiado:
- Só pra empresas americanas por enquanto. O resto do mundo vai assistir por um tempo.
- A integração com Codex é o veículo de entrega, o que silenciosamente prende os pesquisadores no stack da OpenAI. Conveniente — e também um muro de proteção.
- Síntese de evidências é a parte fácil. Planejamento experimental que sobrevive num laboratório molhado é outro problema totalmente diferente — e "nossa IA sugeriu esse protocolo" vai colidir com "as células morreram do mesmo jeito" muitas vezes antes disso virar algo chato.
Mas a direção é real. Estamos saindo da era de "modelo geral, prompt específico" e entrando na era de modelos de fronteira especializados para domínios específicos. O GPT-Rosalind é o primeiro fora de software.
O próximo provavelmente escreve petições jurídicas. O depois dele lê exames de radiologia. Não diga que eu não avisei.
Fontes
- Introducing GPT-Rosalind for life sciences research — anúncio oficial da OpenAI
- OpenAI Launches GPT-Rosalind — MarkTechPost, com o detalhamento dos benchmarks
- OpenAI takes on Google with new AI model aimed at drug discovery — Bloomberg, ângulo competitivo
- OpenAI launches new AI model for life sciences research — Axios, enquadramento de negócios
- Isomorphic Labs — braço de descoberta de drogas da Alphabet, o principal competidor nesse espaço