Internet będzie jeszcze gorszy. Internetowe archiwum straci dostęp do Reddita

Reddit zablokuje Internet Archive i Wayback Machine możliwość zapisywania stron z subredditów. Powodem ma być korzystanie z archiwum przez firmy trenujące sztuczną inteligencję.

Źrodło fot. Brett Jordan; Unsplash.com; 2020Źrodło fot. Brett Jordan; Unsplash.com; 2020
Redakcja GRYOnline.pl

Wayback Machine należące do Internet Archive nie zapisze już podstron Reddita. Portal zablokuje dostęp dla bota, bo firmy trzecie miały wykorzystywać archiwum do trenowania sztucznej inteligencji. Argument administracji Reddita już został poddany pod wątpliwość, biorąc pod uwagę wcześniejsze działania portalu. Dla internautów to blokada przed zachowaniem zanikającej historii Internetu (vide The Verge).

Reddit nie pozwoli zarchiwizować subredditów

Dotychczas na Wayback Machine mogliśmy znaleźć różne informacje z Reddita. To mogły być indywidualne wątki, komentarze lub nawet profile użytkowników. To dawało wgląd w odległą historię jednego z najaktywniejszych portali mediów społecznościowych. To jednak się zmieni, o czym poinformował rzecznik prasowy Reddita Tim Rathschmidt:

Internet Archive zapewnia usługę dla całego Internetu, ale zwróciliśmy uwagę na przypadki, gdy firmy AI naruszały politykę platform, w tym naszą i zbierały dane z Wayback Machine.

Zmiany wchodzą w życie już teraz, a bot Wayback Machine będzie miał ostatecznie dostęp wyłącznie do strony głównej Reddita. Oznacza to, że archiwizowana będzie jedynie informacja o najpopularniejszych postach danego dnia i o danej porze.

Według władz portalu jest to potrzebne, aby chronić użytkowników platformy, a zmiana może zostać cofnięta, jeśli regulamin serwisu będzie przestrzegany. Pojawiają się jednak wątpliwości, czy Redditowi faktycznie chodzi o dobro użytkowników. Wspomniano o firmach AI trenujących swoje modele na danych z serwisu. Władze portalu nie miały jednak problemu z udostępnieniem tych informacji, jeśli ktoś za to zapłacił (jak Google i OpenAI).

Zachowanie Internetu jest potrzebne

Internet Archive jest organizacją non-profit, więc w przeciwieństwie do Google nie będzie mogła zapłacić 60 milionów dolarów rocznie, aby bot znowu mógł zapisywać poszczególne wątki lub subreddity. Problem może wydawać się trywialny, ale wielu internautów tęskni do starych czasów i Wayback Machine daje wgląd w przeszłość.

Dzięki temu możemy m.in. podziwiać, jak wyglądało Gry-Online.pl 13 sierpnia 2003 roku. Korzystanie z Wayback Machine to okno na „stary Internet”, gdy fora były u szczytu popularności, a spamerskie komentarze od botów były czymś rzadkim (i szybko pojawiały się bany).

Newsroom Gry-Online.plweb.archive.org

Tym bardziej, że Internet zanika. Jak pokazały badania Pew Research Center, aż 38% stron internetowych, do których mieliśmy dostęp jeszcze w 2013 roku, nie istnieje. Badacze zwrócili uwagę, że około 54% artykułów na Wikipedii ma hiperłącza, które powinny odnosić do pewnych źródeł, ale strona z nimi została usunięta. Natomiast blisko 23% zwykłych stron internetowych ma niedziałające hiperłącza.

Zawsze istnieje szansa, że bot Wayback Machine zapisał dany portal, przez co źródło danej informacji zostało zachowane. Jako organizacja non-profit Internet Archive nie ma szans na zapisanie wszystkiego, ale to, co zostało archiwizowane, jest dla nas szeroko dostępne.

Wybrane dla Ciebie

Ciechanów: Kradzież elektronarzędzi wartych 23 tysiące złotych
Ciechanów: Kradzież elektronarzędzi wartych 23 tysiące złotych
Dziękonie: Kierowca auta osobowego zginął po zderzeniu z ciągnikiem
Dziękonie: Kierowca auta osobowego zginął po zderzeniu z ciągnikiem
Poznań: Tysięczne dziecko urodzone w tym roku w szpitalu miejskim to dziewczynka
Poznań: Tysięczne dziecko urodzone w tym roku w szpitalu miejskim to dziewczynka
Zabraknie mąki na chleb? Izba Zbożowo-Paszowa nie ma wątpliwości
Zabraknie mąki na chleb? Izba Zbożowo-Paszowa nie ma wątpliwości
Szczawnica: Ogromne straty po pożarze. Nadal nie wiadomo, jak doszło do pożaru
Szczawnica: Ogromne straty po pożarze. Nadal nie wiadomo, jak doszło do pożaru
Sprawdź, jakie owoce i warzywa Polacy jedzą najchętniej. Jabłka, borówki, czereśnie - najnowsze trendy konsumpcji w Polsce 2025
Sprawdź, jakie owoce i warzywa Polacy jedzą najchętniej. Jabłka, borówki, czereśnie - najnowsze trendy konsumpcji w Polsce 2025
Radom: Półkolonie połączone z warsztatami z programowania. Wydarzenie cieszy się sporym zainteresowaniem dzieci
Radom: Półkolonie połączone z warsztatami z programowania. Wydarzenie cieszy się sporym zainteresowaniem dzieci
Pałecznica: Ścierniska płoną prawie codziennie. Ogniowa plaga w gminie
Pałecznica: Ścierniska płoną prawie codziennie. Ogniowa plaga w gminie
Legnica: Czego brakuje mieszkańcom? Tych miejsc chcą na mapie miasta
Legnica: Czego brakuje mieszkańcom? Tych miejsc chcą na mapie miasta
Lublin: Rusza konkurs o stypendium dla uczniów warte 60 tys. euro
Lublin: Rusza konkurs o stypendium dla uczniów warte 60 tys. euro
Poddębice: Jechał rowerem po alkoholu i z metamfetaminą! Został skontrolowany przez policję
Poddębice: Jechał rowerem po alkoholu i z metamfetaminą! Został skontrolowany przez policję
Zaatakował śpiącego 65-latka w motelu. Grozi mu do 30 lat więzienia
Zaatakował śpiącego 65-latka w motelu. Grozi mu do 30 lat więzienia