- Mais de 340 sites de notícias locais nos EUA estão limitando o acesso ao Internet Archive, bloqueando bots de arquivamento.
- Em maio, o conjunto chegou a 382 veículos, com a maioria sendo locais; entre os proprietários estão USA Today Co., McClatchy, Advance Local, MediaNews Group e Tribune Publishing.
- Advance Local confirmou o bloqueio desde agosto, enquanto Alden Global Capital também impõe restrições em várias publicações do grupo; há críticas sobre os impactos na preservação de conteúdo jornalístico.
- Editoras como The Atlantic e Folha de S. Paulo passaram a bloquear o Internet Archive; outras publicações internacionais também adotaram medidas semelhantes para reduzir o uso de seus conteúdos por IA.
- O debate envolve custos de arquivamento, direitos de propriedade intelectual e a necessidade de licenciamento; o Internet Archive lidera um programa de preservação com parcerias, visando fortalecer a memória jornalística, mas há resistência entre editores.
Observa-se uma tendência de restringir o acesso ao Internet Archive por grandes redes de jornais locais. Editoras como McClatchy, Advance Local, Tribune Publishing e outras passaram a limitar a atuação de bots de arquivamento em seus sites.
A mudança impacta mais de 340 sites de notícias locais nos Estados Unidos, segundo levantamento do Nieman Lab. A maioria das publicações pertence a grandes grupos, como USA Today Co., McClatchy, Advance Local, MediaNews Group e Tribune Publishing.
Dados indicam que, desde janeiro, houve expansão dessas restrições. Em particular, editoras associadas a Alden Global Capital adotaram medidas para bloquear o serviço de arquivamento, afetando centenas de veículos regionais.
Ameaça à preservação
Especialistas lembram que o Wayback Machine é crucial para capturar matérias jornalísticas ao longo do tempo. O bloqueio reduz a capacidade de preservar conteúdo de fontes locais, o que pode dificultar pesquisas históricas e a verificação de fatos.
Jornalistas dependem com frequência de arquivos para apurar informações antigas ou acompanhar a evolução de uma matéria. Petições online encorajam veículos a permitir a preservação de seus conteúdos pelo Internet Archive.
Respostas e ações
A Wayback Machine afirmou que está dialogando com editoras para abordar preocupações, apontando que seus termos de uso permitem uso acadêmico e de pesquisa. Também tem implementado controles para limitar uso indevido por bots e parcerias com provedores de monitoramento.
Editoras destacam motivos econômicos e estratégicos para o bloqueio. Entre elas estão Advance Local, Alden Global Capital e conteúdos da Condé Nast, que incluem várias publicações reputadas, como Vogue e The New Yorker.
Exemplos de casos
A Advance Local confirmou, em comunicado, que o bloqueio começou de forma preventiva e não depende de evidência de extração por IA. Entre as publicações citadas estão Cleveland Plain Dealer, PennLive e OregonLive.
Alden Global Capital, proprietária de várias redes de jornais, mantém disputas sobre uso de conteúdo para treinamento de IA. Em veículos da empresa, editoriais e decisões estratégicas já sinalizam resistência a permitir uso sem licenciamento.
Caminhos de preservação
Especialistas ressaltam a importância de múltiplas frentes de arquivamento. Além do Internet Archive, editoras recorrem a arquivos pagos e a estratégias próprias de preservação digital. A transição para o meio digital elevou a necessidade de gestão de conteúdos antigos.
Iniciativas colaborativas buscam apoiar redações na criação de planos de preservação. Programas que envolvem universidades, organizações de jornalismo e startups visam ampliar a disponibilidade de cópias estáveis de materiais jornalísticos.
Ponto final
O cenário mostra um equilíbrio entre proteção de propriedade intelectual e acesso à memória jornalística. Enquanto editoras avaliam custos e modelos de licenciamento, o Internet Archive continua sendo referência para conservar o legado das redações locais.
Entre na conversa da comunidade