Reddit zablokował jedną z największych wyszukiwarek. „Nie płacą, to nie dostaną dostępu”

Platforma społecznościowa i agregator treści Reddit ma ponad 1,2 miliarda użytkowników. Każdego dnia w serwisie pojawia się mnóstwo nowych treści i opinii, które są atrakcyjne dla algorytmów sztucznej inteligencji — mogą służyć za cenny materiał do trenowania AI. A raczej mogły, bo Reddit zablokował kilku gigantów, w tym Microsoft. Dyrektor generalny spółki mówi wprost: „Nie płacili za dostęp, to go nie dostaną”.

Steve Huffman, dyrektor generalny Reddit, przez parę miesięcy prowadził rozmowy z Google i OpenAI, aby nawiązać współpracę. Ostatecznie zarząd firmy podpisał umowy z gigantami technologicznymi, aby ci mogli wykorzystywać treści Reddita do trenowania swoich modeli AI. Za dostęp do opinii, komentarzy, artykułów i innych treści Google zapłaci Redditowi ok. 60 mln dol.

W tym samym czasie inne wyszukiwarki, m.in. Bing Microsoftu, również przetwarzały dane z serwisu Reddit i wykorzystywały je do trenowania algorytmów sztucznej inteligencji. Po co więc płacić 60 mln dol. za dostęp do czegoś, z czego konkurencja korzysta za darmo? Huffman uznał, że korzystanie z danych Reddita powinno być płatne. „Nie możemy pozostawać całkowicie otwarci, ponieważ musimy bardzo uważać, gdzie trafiają nasze dane i do czego są wykorzystywane” — stwierdził Huffman.

Współpraca z Google nie jest na wyłączność. Inne firmy również mogą korzystać z zasobów Reddita, ale muszą zapłacić. Robi to OpenAI, choć nie jest jasne, ile pieniędzy spółka prowadzona przez Sama Altmana przeznaczyła na tę współpracę. Nieoficjalnie natomiast mówi się, że to nawet 200 mln dol. za dostęp do treści przez trzy lata.

Reddit wprowadził nową politykę zasad, według której dostęp do treści — w tym komentarzy i postów użytkowników — nie jest możliwy dla wyszukiwarek i serwisów AI, chyba że podpiszą one umowy komercyjne. „Domyślnie blokujemy teraz wszystkie roboty do przetwarzania treści, z jakimi nie mamy formalnej umowy” — podkreślił szef Reddita.

W praktyce oznacza to, że konkurenci OpenAI, tacy jak Perplexity czy Anthropic, nie mają już dostępu do Reddita. Nie ma go nawet Microsoft i jego wyszukiwarka Bing.

Google i inne wyszukiwarki od dawna są ważnymi źródłami ruchu dla Reddita i miliony osób szuka odpowiednich postów właśnie na tej platformie. Jeśli chodzi o dzienny ruch, nawet 40 do 50 proc. odwiedzin na Reddicie pochodzi z Google’a. Gigant wyszukiwania miał zatem łatwiejsze pole do negocjacji, jeśli chodzi o zawieranie umowy związanej ze szkoleniem swojej AI — zapewnia ogromny ruch w serwisie i dzięki temu nie musiał płacić o wiele więcej za dostęp do treści. Umowa początkowo miała bowiem opiewać na kwotę ponad 100 mln dol.

Huffman powiedział, że nie chciałby utrudniać dostępu do Reddita np. użytkownikom wyszukiwarki Bing. Dane jednak zyskały na wartości w dobie sztucznej inteligencji. Jak tłumaczy, kiedy technologie wyszukiwarek były wykorzystywane do tego, aby jedynie agregować treści i za pomocą prostych linków przekierowywać odbiorców na poszczególne strony, było to w porządku. Wyszukiwarki wyświetlały reklamy przy linkach, zarabiając za „agregację”, użytkownicy zaś w jednym miejscu mogli łatwo przeszukiwać internet i trafiać tam, gdzie chcieli. „Teraz ludzie używają danych z Reddit do treningu AI, odsprzedają je innym firmom, czy też tworzą podsumowania wyszukiwań, zamiast linkować do nas i zapewniać nam ruch” — mówi Huffman. To sprawia, że nie zamierza dłużej godzić się na to, aby treści z Reddita były wykorzystywane w taki sposób bez odpowiednich umów komercyjnych.

Wiemy już, że Bing, a także Anthropic i Perplexity korzystały z Reddita i nie były skłonne do przestrzegania nowej polityki. Z tego powodu zostały zablokowane.

Czytaj też: Meta chce przebić ChatGPT. Miliarder przekonuje, że jego AI jest „najbardziej zaawansowana na świecie”

Microsoft powiedział, że honoruje odpowiednie zasady dostarczane przez poszczególne strony internetowe i jeśli dana strona nie chce, aby Bing ją indeksował i przetwarzał, nie jest to realizowane. Od 1 lipca Bing przestał więc przeszukiwać Reddita.

Perplexity, rozwiązanie krytykowane przez media i dostawców treści za to, że tworzy podsumowania i podaje szczegółowe informacje bez przekierowywania ruchu na oryginalne strony, również wykorzystywało Reddita i przestało to robić. Obecnie firma nawiązała partnerstwa m.in. z Time, Fortune i WordPress.com. Ma specjalny „program dla wydawców” i zachęca, aby Reddit do niego przystąpił. Firma Huffmana nie zamierza tego zrobić.

Anthropic z kolei powiedział, że szanuje sygnał Reddita dotyczący blokowania przeszukiwania stron. „Reddit znajduje się na naszej liście blokad dla przeszukiwania sieci od połowy maja i od tego czasu nie dodaliśmy żadnych adresów URL z Reddita do naszego systemu” — czytamy w komunikacie spółki.

Decyzja Reddita może sprawić, że wiele innych dużych serwisów internetowych pójdzie tą samą drogą. Dane i treści są obecnie wykorzystywane do nowych celów, w dodatku zarobkowych. Jeśli więc nie chcemy zgadzać się na to, aby giganci technologiczni zarabiali na naszych treściach i za darmo szkolili swoje AI, powinniśmy zawalczyć o odpowiednie umowy licencyjne.

Sprawdź też: Komputery PC zapewnią większy wybór i niższe ceny

W najgorszej sytuacji znajdą się mniejsi wydawcy i serwisy. Takie strony mogą czerpać ruch głównie z przekierowań od wyszukiwarek i ich sytuacja negocjacyjna może być kiepska. Wystarczy, że dany gigant nie zechce płacić za dostęp do treści i wtedy, owszem, nie będzie wykorzystywał ich do trenowania swoich modeli AI, ale przestanie też przesyłać ruch, od którego uzależniony może być model biznesowy danego serwisu. Co wtedy? Pozostanie budowanie zamkniętej społeczności i bazy mailingowej, aby zapewnić sobie bardziej bezpośrednie dotarcie do odbiorców.

Autor: Grzegorz Kubera, dziennikarz Business Insider Polska

Dziękujemy, że przeczytałaś/eś nasz artykuł do końca. Bądź na bieżąco! Obserwuj nas w Wiadomościach Google.

Źródło

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Nazwa *

Adres e-mail *

Dodaj komentarz *

No votes yet.

Please wait...

Dodaj komentarzAnuluj odpowiedź