La Wayback Machine, véritable archive vivante d’Internet, pourrait se retrouver en péril face à l’essor fulgurant de l’intelligence artificielle. Cet outil, géré par l’Internet Archive, permet de remonter dans le temps pour consulter des versions passées de sites web, constituant une ressource unique pour les historiens, journalistes, chercheurs et juristes. Mais selon Numerama, la multiplication des modèles d’IA qui aspirent massivement les contenus du web soulève un enjeu double : la protection de la mémoire numérique et la préservation de la propriété intellectuelle.
Une exploitation massive des archives qui brouille les frontières du droit d’auteur
L’essor de l’IA générative a ouvert la voie à des usages intensifs de bases de données comme la Wayback Machine. Les modèles d’IA, pour s’entraîner, peuvent collecter des milliards de pages archivées, y compris des contenus protégés par le droit d’auteur. Ce phénomène pose un problème juridique majeur : la loi sur la propriété intellectuelle protège ces œuvres, même si elles ne sont plus en ligne. Or, l’Internet Archive a toujours reposé sur un principe de préservation, et non d’exploitation commerciale.
La récupération massive de ces données par des acteurs privés soulève donc la question de savoir si les créateurs originaux conservent un contrôle sur leurs œuvres une fois qu’elles sont absorbées par les modèles d’IA. Les experts rappellent que le « fair use » aux États-Unis ou les exceptions de fouille de textes et de données en Europe n’autorisent pas tout, et que l’exploitation commerciale d’œuvres protégées sans accord explicite peut constituer une violation flagrante des droits d’auteur.
Un patrimoine numérique menacé par la course à l’IA
Si la Wayback Machine venait à être détournée de sa vocation d’archive au profit d’objectifs purement commerciaux, le risque serait double. D’abord, une perte de confiance des créateurs et éditeurs, qui pourraient chercher à faire retirer leurs contenus par crainte d’un usage abusif. Ensuite, une pression juridique accrue sur l’Internet Archive, qui pourrait voir sa mission fragilisée par des plaintes ou des restrictions législatives.
Au-delà des aspects techniques, c’est la question de la souveraineté culturelle et informationnelle qui se pose. La Wayback Machine joue un rôle essentiel dans la transparence, la lutte contre la désinformation et la conservation du patrimoine numérique mondial. Mais l’exploitation massive de ses archives par l’IA pourrait transformer un outil de mémoire collective en simple réservoir de données au service de modèles privés, souvent opaques sur leurs méthodes d’entraînement.
Alors que les législateurs européens et américains s’attaquent aux encadrements juridiques de l’IA, la question de la protection des archives numériques et de leur propriété intellectuelle devient urgente. Faute de règles claires, l’histoire du web pourrait devenir une matière première gratuite pour les intelligences artificielles, au détriment de ceux qui l’ont construite.