Post
A Internet Aprendeu a Esquecer
A web era o lugar onde nada sumia. Agora é onde nada fica. Um olhar sobre link rot, amnésia algorítmica e quem ainda segura a linha.
Tenta achar um blog post que alguém te mandou em 2015. Não o tema — a página em si. Tenta desenterrar um tweet que você viu em 2020. Tenta abrir um bookmark antigo do notebook que você usava cinco anos atrás.
Pode tentar. Eu espero.
Durante boa parte dos anos 2000, a característica que definia a internet era que nada sumia. Você podia esbarrar numa página do GeoCities de 1998 e ela tava lá, ainda piscando, ainda orgulhosa. O brilhantismo do Google antigo era justamente trazer coisas antigas à tona. A web era uma biblioteca cujo bibliotecário nunca jogava nada fora.
Isso já não é mais verdade. A internet hoje é um rio. O que passa flutuando essa semana é alto e brilhante. Tudo rio acima tá turvo, e boa parte sumiu.
Como Ficam os Números
A Pew Research fez a conta em 2024, e é mais feio do que a maioria das pessoas imagina.
| O Que Sumiu | Até Quando | Fonte |
|---|---|---|
| 25% de todas as páginas da web de 2013–2023 | Out 2023 | Pew 2024 |
| 38% das páginas especificamente de 2013 | Out 2023 | Pew 2024 |
| 8% das páginas de 2023 | Out 2023 | Pew 2024 |
| ~20% dos posts no X (Twitter) | 2024 | Pew 2024 |
| 11% das referências externas da Wikipedia | 2024 | Pew 2024 |
| 50% dos URLs citados em opiniões da Suprema Corte dos EUA | 2014 | Harvard Law Review |
| 70%+ dos URLs citados na Harvard Law Review | 2014 | Harvard Law Review |
Essa última linha devia te fazer parar. Pesquisa jurídica — o tipo de escrita mais obcecada por nota de rodapé no planeta — perde a maioria dos seus links externos em poucos anos. Se opiniões da Suprema Corte não conseguem segurar suas próprias citações, que chance tem aquela thread do Slack que você teve em 2021?
E repara no padrão das três primeiras linhas: 8% do conteúdo de 2023 já sumiu. As coisas não tão sobrevivendo nem ao primeiro ano.
Como a Internet Começou a Esquecer
Três mudanças aconteceram mais ou menos ao mesmo tempo, e juntas reprogramaram a relação da web com o passado.
1. Eventos de extinção de plataforma. O GeoCities foi desligado pelo Yahoo em outubro de 2009. O Google Reader em julho de 2013. O Vine em 2017. O Google+. A era original do Tumblr. Cada shutdown levou milhões de páginas junto. Algumas foram resgatadas pelo Archive Team e companhia. A maioria não foi. Quando uma plataforma morre, o conteúdo dela morre junto — e os links apontando pra aquele conteúdo pelo resto da web viram lápides.
2. A timeline substituiu a timeline. O Twitter trocou pra feed algorítmico em 2016. Instagram em 2016. TikTok já nasceu algorítmico. A palavra "timeline" parou de significar "registro cronológico" e começou a significar "o que o algoritmo acha que você quer ver agora." Conteúdo já não é mais organizado por quando. É organizado por engajamento. Um post brilhante de 18 meses atrás é funcionalmente invisível, não porque sumiu, mas porque nenhum feed vai trazer ele de volta.
3. A busca começou a se importar com frescor. O ranqueamento do Google hoje pesa bastante a recência pra maioria das queries. Conteúdo antigo é rebaixado, mesmo quando é mais preciso. SEO acelerou isso — toda peça de "evergreen content" eventualmente é ultrapassada por um listicle gerado por IA de 2026 com melhor schema markup. A página antiga boa ainda tá no ar. Você só não consegue encontrar.
O Pessoal Segurando a Linha
A internet não tá esquecendo sozinha. Existe um contramovimento, e você provavelmente já usou sem pensar.
O Internet Archive foi fundado por Brewster Kahle em 1996 — antes do Google existir. A Wayback Machine lançou em outubro de 2001. Em outubro de 2025, já tinha arquivado mais de um trilhão de páginas e 99+ petabytes de dados. Uma ONG pequena tá segurando boa parte da memória da web com um orçamento relativamente apertado, e o resto de nós só percebe isso quando um link dá 404 e a gente reflexivamente digita web.archive.org/web/*.
Tem também o Perma.cc, construído pelo Library Innovation Lab de Harvard, justamente pra que citações acadêmicas parem de apodrecer. O Pinboard continua de pé como a ferramenta de bookmark que se recusa a morrer. Tem voluntários do Archive Team que literalmente correm pra resgatar plataformas antes que sejam desligadas. Esses projetos são heroicos. Também tão estruturalmente em desvantagem — os dados da Pew são o que a web parece com esses arquivos rodando a todo vapor.
Por Que Isso Importa Agora
Eis a parte que me tira o sono.
Todo modelo de IA no mercado é treinado no que a internet lembra. Se a memória da internet tá se deformando — mais recente, menos arquival, achatada pelo algoritmo — a noção de história do modelo se deforma junto. O entendimento de um LLM sobre "a web em 2012" é montado com as páginas que sobreviveram até 2023. As páginas sobreviventes não são uma amostra representativa. Elas pendem pra sites institucionais, Wikipedia, e qualquer coisa que SEO tenha conseguido manter viva.
Cada nova geração de modelo herda uma memória mais curta, mais estranha, mais homogênea do que a web já foi. Os blogs e fóruns onde boa parte da escrita realmente interessante aconteceu entre 2005 e 2015 tão sumindo mais rápido que o conteúdo corporativo que substituiu. O sinal enfraquece enquanto o ruído segue alto.
Isso não é conspiração. É física. Mas o efeito cumulativo é que o material de referência principal da humanidade hoje é um highlight reel dos últimos 18 meses mais o que a Wikipedia conseguiu colocar em nota de rodapé a tempo.
O Que Você Realmente Pode Fazer
Nada disso é consertável em nível individual. Mas o nível individual é onde estão as pequenas vitórias:
- Arquive antes de linkar. Se você cita algo num post, passa pelo
web.archive.org/saveantes. Leva três segundos. Dá ao link uma segunda vida. - Salve localmente o que importa. Não só marcar como favorito — baixa a página, o PDF, a imagem. Bookmarks são uma promessa que a web não cumpre.
- Linke pro URL canônico, não o com parâmetros de tracking. A chance de sobrevivência aumenta.
- Pague pelos serviços de arquivo que funcionam. Pinboard, doações pro Internet Archive. Tão rodando no vapor comparado ao que preservam.
A Coisa que Eu Não Consigo Parar de Pensar
A internet costumava ser criticada por nunca esquecer. Foi todo o pânico de "registro digital permanente" dos anos 2010. Um tweet constrangedor podia te seguir pra sempre.
Ganhamos. Quase nada mais te segue. Nem seu tweet constrangedor. Nem seu blog post bom. Nem a thread do fórum onde você descobriu algo. Nem a seção de comentários onde um estranho fez você mudar de ideia.
A internet não parou de lembrar porque a gente pediu. Parou de lembrar porque lembrar deixou de ser lucrativo, e esquecer escala melhor. E agora o meio que construímos pra ser a memória da humanidade tá silenciosamente virando o oposto.
Isso não é um bug. É o novo padrão. E o estranho é — quase ninguém tá falando disso, porque os posts dizendo isso não apareceriam no seu feed mesmo.
Sources
- When Online Content Disappears — Pew Research Center, Maio 2024 — o estudo de link rot com os números de 25% / 38% / Wikipedia / Twitter
- Perma: Scoping and Addressing the Problem of Link and Reference Rot in Legal Citations — Harvard Law Review, 2014 — Zittrain, Albert e Lessig sobre os 70%+ de reference rot em citações jurídicas
- Internet Archive — Wikipedia — história do Archive, escala da Wayback Machine, contagem de petabytes
- Wayback Machine — a fonte primária, de alguma forma ainda rodando
- Perma.cc — Harvard Library Innovation Lab — a ferramenta de preservação de citações construída justamente em resposta ao estudo de Harvard de 2014