Dezenas de Sites de Notícias Bloqueiam a Wayback Machine: O Fim da Memória Digital?

Os Desafios do Internet Archive e Seus Efeitos sobre a História Digital

Nos últimos tempos, o Internet Archive, uma das maiores bibliotecas digitais, tem enfrentado crescentes restrições impostas por grandes veículos de comunicação. Essa situação levanta preocupações sérias sobre a preservação da informação e o acesso a registros históricos.

Restrição de Acesso

De acordo com uma análise da Originality AI, pelo menos 23 grandes sites de notícias decidiram bloquear o robô de arquivamento do Internet Archive, conhecido como ia_archiverbot. Essas proibições são significativas, considerando que grupos como o USA Today Co. gerenciam mais de 200 veículos de comunicação. O resultado é uma redução drástica na capacidade do Internet Archive de coletar e preservar versões anteriores de páginas da internet.

Embora algumas organizações de mídia aleguem que o uso das páginas arquivadas para treinar inteligências artificiais pode infringir direitos autorais, mais de 100 jornalistas assinaram uma carta em defesa do Internet Archive. Eles alertam para o risco do desaparecimento progressivo de registros digitais, algo fundamental para manter a transparência e a histórica narrativa da internet.

O Medo do Uso Indevido

O receio em relação ao uso dos conteúdos arquivados para treinar modelos de linguagem é crescente. O New York Times, por exemplo, tem defendido que o acesso aos materiais arquivados deve ser restringido, argumentando que isso protege seus direitos autorais e seu modelo de negócios. A publicação sugere que as empresas de tecnologia precisam negociar acordos com os veículos de comunicação para acessar esses dados.

As restrições têm variações. Enquanto o NYT bloqueia completamente o acesso, outras plataformas, como o The Guardian, permitem algum rastreamento, mas restringem o público à informação.

A Realidade no Brasil

Curiosamente, as principais publicações brasileiras ainda não aderiram a esse movimento de boicote. Jornais como Globo, Folha de São Paulo e outros não possuem restrições quanto ao acesso pelo Internet Archive. No entanto, mesmo essas plataformas podem não permitir a raspagem de dados por agentes de IA, levantando questões sobre acesso a informações no futuro.

Impacto na Transparência e no Registro Histórico

As restrições ao Internet Archive têm implicações diretas sobre a transparência da informação. A possibilidade de consultar versões anteriores de páginas é uma ferramenta vital para verificar alterações, rastrear declarações ou identificar revisões não documentadas. Por exemplo, em 2016, o Internet Archive conseguiu expor uma edição não sinalizada do New York Times em um artigo sobre Bernie Sanders, demonstrando a importância desse serviço para a integridade da informação.

Além disso, o crescente movimento de se bloquear o arquivamento já era perceptível desde o início do ano, como evidenciado por um estudo do Nieman Lab, da Universidade Harvard, que apontou o aumento das limitações. Mark Graham, diretor da Wayback Machine, também expressou suas preocupações, afirmando que impedir o registro das páginas pode causar “danos históricos”.

Conclusão

O futuro do Internet Archive e, consequentemente, da preservação digital, está em risco. A tensão entre direitos autorais e o acesso à informação é mais relevante do que nunca. À medida que a discussão avança, o equilíbrio entre proteger os interesses de grandes veículos de comunicação e garantir a transparência e o acesso à informação histórica será um tema de importância crescente.

Rolar para cima