Internet będzie jeszcze gorszy. Internetowe archiwum straci dostęp do Reddita
Reddit zablokuje Internet Archive i Wayback Machine możliwość zapisywania stron z subredditów. Powodem ma być korzystanie z archiwum przez firmy trenujące sztuczną inteligencję.
Wayback Machine należące do Internet Archive nie zapisze już podstron Reddita. Portal zablokuje dostęp dla bota, bo firmy trzecie miały wykorzystywać archiwum do trenowania sztucznej inteligencji. Argument administracji Reddita już został poddany pod wątpliwość, biorąc pod uwagę wcześniejsze działania portalu. Dla internautów to blokada przed zachowaniem zanikającej historii Internetu (vide The Verge).
Reddit nie pozwoli zarchiwizować subredditów
Dotychczas na Wayback Machine mogliśmy znaleźć różne informacje z Reddita. To mogły być indywidualne wątki, komentarze lub nawet profile użytkowników. To dawało wgląd w odległą historię jednego z najaktywniejszych portali mediów społecznościowych. To jednak się zmieni, o czym poinformował rzecznik prasowy Reddita Tim Rathschmidt:
Internet Archive zapewnia usługę dla całego Internetu, ale zwróciliśmy uwagę na przypadki, gdy firmy AI naruszały politykę platform, w tym naszą i zbierały dane z Wayback Machine.
Zmiany wchodzą w życie już teraz, a bot Wayback Machine będzie miał ostatecznie dostęp wyłącznie do strony głównej Reddita. Oznacza to, że archiwizowana będzie jedynie informacja o najpopularniejszych postach danego dnia i o danej porze.
Według władz portalu jest to potrzebne, aby chronić użytkowników platformy, a zmiana może zostać cofnięta, jeśli regulamin serwisu będzie przestrzegany. Pojawiają się jednak wątpliwości, czy Redditowi faktycznie chodzi o dobro użytkowników. Wspomniano o firmach AI trenujących swoje modele na danych z serwisu. Władze portalu nie miały jednak problemu z udostępnieniem tych informacji, jeśli ktoś za to zapłacił (jak Google i OpenAI).
Zachowanie Internetu jest potrzebne
Internet Archive jest organizacją non-profit, więc w przeciwieństwie do Google nie będzie mogła zapłacić 60 milionów dolarów rocznie, aby bot znowu mógł zapisywać poszczególne wątki lub subreddity. Problem może wydawać się trywialny, ale wielu internautów tęskni do starych czasów i Wayback Machine daje wgląd w przeszłość.
Dzięki temu możemy m.in. podziwiać, jak wyglądało Gry-Online.pl 13 sierpnia 2003 roku. Korzystanie z Wayback Machine to okno na „stary Internet”, gdy fora były u szczytu popularności, a spamerskie komentarze od botów były czymś rzadkim (i szybko pojawiały się bany).
Tym bardziej, że Internet zanika. Jak pokazały badania Pew Research Center, aż 38% stron internetowych, do których mieliśmy dostęp jeszcze w 2013 roku, nie istnieje. Badacze zwrócili uwagę, że około 54% artykułów na Wikipedii ma hiperłącza, które powinny odnosić do pewnych źródeł, ale strona z nimi została usunięta. Natomiast blisko 23% zwykłych stron internetowych ma niedziałające hiperłącza.
Zawsze istnieje szansa, że bot Wayback Machine zapisał dany portal, przez co źródło danej informacji zostało zachowane. Jako organizacja non-profit Internet Archive nie ma szans na zapisanie wszystkiego, ale to, co zostało archiwizowane, jest dla nas szeroko dostępne.