Actualité GeekIT, Data & IATechnologies

Wayback Machine : des centaines de sites bloquent l’archivage et menacent l’accès aux anciennes pages d’Internet

L’essor fulgurant de l’intelligence artificielle bouleverse déjà l’accès à l’information… et pourrait désormais fragiliser la mémoire même du web. Derrière la simplicité des réponses instantanées fournies par les chatbots se cache un effet secondaire inquiétant. Des acteurs majeurs du numérique commencent à verrouiller leurs contenus, mettant en péril l’un des piliers de l’histoire d’Internet. Une évolution qui pourrait priver les internautes d’un accès essentiel au passé numérique.

L’intelligence artificielle simplifie tout mais fait émerger de nouveaux problèmes

L’intelligence artificielle s’est imposée comme un réflexe quotidien pour des millions d’utilisateurs. Trouver une information, résumer un texte ou générer du contenu ne prend plus que quelques secondes.

Mais cette facilité a un coût. L’augmentation massive des besoins en stockage et en puissance de calcul dans les centres de données entraîne déjà des effets concrets, comme la hausse du prix de certains équipements technologiques.

En parallèle, la confiance accordée à ces outils reste débattue. De nombreux spécialistes rappellent que leurs réponses ne sont pas toujours fiables sans vérification humaine.

L’Internet Archive voit sa mission historique fragilisée

Créé en 1996, l’Internet Archive constitue la plus grande bibliothèque numérique au monde. Sa mission est simple : conserver le contenu du web et garantir un accès libre à l’information.

Grâce à son service emblématique, la Wayback Machine, il est possible de consulter d’anciennes versions de sites et de retrouver des pages supprimées.

Pour fonctionner, l’organisation utilise des robots qui parcourent Internet et enregistrent des copies des pages. C’est précisément ce système qui est aujourd’hui remis en cause.

Des centaines de sites bloquent désormais l’archivage

Une enquête menée par Nieman Lab révèle une tendance nette : de plus en plus de médias refusent l’accès aux robots de l’Internet Archive.

Parmi eux figurent le Financial Times, le The New York Times, The Athletic ou encore The Guardian.

Au total, 241 sites d’information dans neuf pays ont restreint l’accès à au moins un robot d’archivage via un fichier qui définit ce que les programmes automatisés peuvent explorer.

Certains médias appliquent des restrictions partielles. D’autres, comme The New York Times, bloquent totalement l’accès.

La crainte d’une utilisation des contenus par l’intelligence artificielle

Derrière ces blocages se cache une inquiétude : les contenus archivés pourraient être utilisés pour entraîner des systèmes d’intelligence artificielle sans autorisation.

Les éditeurs redoutent que l’Internet Archive devienne un moyen indirect d’exploiter leurs données.

Le fondateur de l’organisation, Brewster Kahle, alerte sur les conséquences : limiter l’accès aux archives revient à priver le public d’une partie de la mémoire collective.

Le phénomène s’étend au-delà des médias

Le mouvement ne concerne pas uniquement la presse. En août 2025, la plateforme Reddit a également bloqué certains robots d’archivage.

Même constat pour le projet Common Crawl : 240 des 241 sites étudiés ont aussi restreint son accès.

Si cette tendance se confirme, les conséquences pourraient être importantes : disparition progressive de contenus supprimés, perte d’accès à d’anciens articles ou à des publications sur les réseaux sociaux.

C’est toute la mémoire du web qui risque de devenir partielle, voire inaccessible.

Je m’appelle Samuel Le Goff. À 38 ans, je suis l’actualité du numérique depuis plus de 14 ans. Aujourd’hui, je m’intéresse particulièrement aux smartphones et aux usages concrets de l’intelligence artificielle, que je traite à travers des contenus clairs et accessibles sur Menow.fr.

Samuel

Je m’appelle Samuel Le Goff. À 38 ans, je suis l’actualité du numérique depuis plus de 14 ans. Aujourd’hui, je m’intéresse particulièrement aux smartphones et aux usages concrets de l’intelligence artificielle, que je traite à travers des contenus clairs et accessibles sur Menow.fr.

Voir tous les articles

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *