Wikimedia Foundation, nezisková organizace stojící za Wikipedií, nyní aktivně požaduje kompenzaci od společností s umělou inteligencí (AI), které používají její data k tréninku svých modelů. Tento krok znamená významný posun v tom, jak budou online úložiště znalostí interagovat s rychle rostoucím průmyslem umělé inteligence.
Klíčový problém: Sběr dat a udržitelnost
Vývojáři umělé inteligence po léta spoléhali na veřejně dostupné datové sady – včetně rozsáhlého, společně upravovaného obsahu Wikipedie – při trénování velkých jazykových modelů (LLM). Wikimedia Foundation však tvrdí, že tato praxe je neudržitelná. Provoz Wikipedie, sedmé nejnavštěvovanější webové stránky na světě, stál ve fiskálním roce 2023–2024 179 milionů dolarů. Nadace funguje primárně na darech a nespoléhá se na příjmy z reklamy, takže je zvláště zranitelná vůči změnám v chování uživatelů.
Problém není jen finanční; jde o přístup. Jak se AI chatboti jako ChatGPT stávají běžnějšími, uživatelé mohou Wikipedii úplně opustit a ignorovat žádosti o dary, které udržují web nad vodou. To vytváří přímý konflikt mezi modelem volného přístupu, který propaguje Wikipedie, a povahou vývoje AI zaměřenou na zisk.
Navrhované řešení: Komerční přístup k API
Wikimedia nabízí řešení: AI společnosti by měly platit za používání jejich Enterprise API. To umožní škálovatelný přístup k obsahu Wikipedie bez přetížení serverů neziskové organizace. Rozhraní API také poskytne zdroj příjmů a podpoří poslání nadace šířit bezplatné znalosti.
Návrh není nový. Google v roce 2022 uzavřel podobnou obchodní smlouvu s Wikimedia, což prokázalo životaschopnost paywallů pro strukturované znalosti. Většina hlavních hráčů v oblasti umělé inteligence – včetně OpenAI, Meta, Anthropic, DeepSeek a xAI – však na žádost Wikimedia zatím nereagovala.
Širší trend: Tvůrci obsahu tlačí zpět
Postoj Wikimedia je v souladu s rostoucím pohybem mezi tvůrci online obsahu, kteří požadují kompenzaci za používání dat AI. Vydavatelé jako The New York Times a News Corp aktivně žalují společnosti AI za porušení autorských práv, zatímco jiní, jako Associated Press a Reuters, uzavřeli licenční smlouvy. To odráží základní napětí mezi open source etikou raného internetu a stále více komercializovaným prostředím AI.
Akce Wikimedia Foundation zdůrazňují kritický bod obratu: bezplatná data již nejsou zaručena. Jak se modely umělé inteligence stávají sofistikovanějšími, hodnota vysoce kvalitních, lidmi spravovaných informací bude jen stoupat. To nevyhnutelně donutí společnosti s umělou inteligencí, aby zvážily náklady – finanční i etické – spojené s používáním volně shromážděných dat.
Závěrem lze říci, že požadavek Wikipedie na platby od společností AI není jen o jejím vlastním přežití. To je předzvěstí širšího přehodnocení v odvětví AI, kde bude přístup k datům stále více stát peníze.
