Perplexity pozwane przez Reddita. Sprawa dotyczy nielegalnego pozyskania danych do trenowania AI
Reddit pozwał Perplexity i inne firmy za kradzież danych ze swojego portalu. Zebrane informacje miały zostać wykorzystane do szkolenia AI bez porozumienia z Redditem.
Reddit pozwał Perplexity AI za bezprawne zbieranie komentarzy użytkowników platformy społecznościowej. Na celowniku Reddita znalazły się także inne firmy, niektóre będące klientami Perplexity. To kolejny przykład problemu, jakim jest pozyskiwanie danych do szkolenia AI. Pozwany gigant stwierdził, że będzie „walczył o wolność klientów do wolnego i równego dostępu do bezpłatnych informacji”.
Reddit pozywa Perplexity
W środę do sądu federalnego stanu Nowy Jork wpłynął pozew Reddita przeciw Perplexity, Oxylabs UAB, domenie AWMProxy i SerpApi (ta ostatnia firma jest klientem Perplexity). W swoim oświadczeniu Reddit wyjaśnił, dlaczego platforma miała być celem:
Scrapery omijają technologiczne bariery, żeby kraść dane i sprzedać je do klientów głodnych materiałów treningowych. Reddit jest głównym celem, ponieważ to jedna z największych i najbardziej dynamicznych kolekcji ludzkich konwersacji.
Z działaniami Reddita nie zgadzają się pozwani, a wypowiedź Perplexity sugeruje, że platforma stawia siebie w roli obrońcy społeczności internetowej:
Nasze podejście wciąż opiera się na tych samych zasadach i odpowiedzialności, że udostępniamy faktyczne odpowiedzi dzięki dokładnemu AI i nie będziemy tolerować gróźb przeciwko otwartości i interesowi publicznemu.
Natomiast Oxylabs zwraca uwagę, że żadna firma nie powinna zarządzać publicznymi danymi i oskarża firmy, które tak robią, że prawdopodobnie robią to, aby je następnie odsprzedać po zawyżonej cenie.
Zdaniem Reddita korporacje zajmujące się scrapowaniem danych z portalu robią to między innymi, omijając zabezpieczenia Google, a następnie korzystają z rekordów wyszukiwarki, aby zebrać potrzebne informacje, co porównano do „napadu na konwój, gdy nie ma się dostępu do skarbca”. Przypomnijmy, że wcześniej Google i OpenAI podpisały umowy z Redditem na dostęp do bazy danych, aby szkolić sztuczną inteligencję. Google płaci 60 milionów dolarów rocznie za tę możliwość. Nie każda firma może sobie na to pozwolić.
W czerwcu z podobnego powodu Reddit pozwał Anthropic.