Reddit ma ponad 1,3 mld użytkowników. Każdego dnia pojawia się tam wiele treści i opinii. Są one atrakcyjne dla algorytmów AI. Jednak z uwagi na to, że stojące za nimi firmy nie chcą ponosić kosztów szkolenia swoich programów sztucznej inteligencji na treściach Reddita, ten postanowił zablokować im dostęp.
Reddit to platforma społecznościowa i agregator treści. Jej 1,2 mld użytkowników każdego dnia wrzuca wiele materiałów i opinii. Na tej bazie mogłyby się szkolić największe programy AI. Jednak giganci zostali zablokowani, bo nie chcieli płacić za dostęp. Pośród nich jest chociażby Microsoft.
Reddit przez wiele miesięcy prowadził nasilone działania przeciwko nieautoryzowanym robotom indeksującym. Zaktualizowano plik robots.txt, co pozwoliło blokować wyszukiwarki, które nie mają podpisanej z platformą umowy. Szczególnie negatywnie firma ocenia działania Microsoftu, który wykorzystywał dane do trenowania AI i generowania podsumowań w wynikach Binga. Jednak nie posiada odpowiedniej zgody i nie podpisał umowy na wykorzystanie treści za odpowiednią opłatą.
Anthropic zapewniło, że przestrzega zasad znajdujących się w dokumencie robots.txt. Potwierdziło, że nie indeksuje Reddita od maja. Natomiast Microsoft odmówił komentarza. Także forma Perplexity nie udziela informacji w tej kwestii.
Reddit negocjuje z gigantami
Steve Huffman, dyrektor generalny Reddit, prowadził rozmowy w sprawie nawiązania współpracy z gigantami, które mają oprogramowanie AI szkolące się na treściach platformy. Były to chociażby Google czy OpenAI. Zgodziły się one płacić za dostęp do treści Reddita takich jak opinie, komentarze czy artykuły. Kwota, na którą opiewa umowa, to ok. 60 mln dol.
Platforma dąży do zawarcia podobnych umówi licencyjnych także z innymi gigantami. Takie same kroki podejmują tradycyjne media, których treści również stanowią bazę do szkolenia AI. Pokazuje to zmieniający się krajobraz cyfrowy, w którym pojawia się ochrona treści, a gromadzenie i wykorzystywanie danych nie jest już traktowane jako oczywistość.
Źródło: businessinsider.com.pl