Wikipedia eist betaling van AI-bedrijven voor datagebruik

19

De Wikimedia Foundation, de non-profitorganisatie achter Wikipedia, is nu actief op zoek naar compensatie van bedrijven op het gebied van kunstmatige intelligentie (AI) die de gegevens gebruiken voor het trainen van hun modellen. Deze stap vertegenwoordigt een aanzienlijke verschuiving in de manier waarop online kennisopslagplaatsen zullen interageren met de snelgroeiende AI-industrie.

Het kernprobleem: dataschrapen en duurzaamheid

Jarenlang hebben AI-ontwikkelaars vertrouwd op openbaar beschikbare datasets – waaronder de enorme, gezamenlijk bewerkte inhoud van Wikipedia – om grote taalmodellen (LLM’s) te trainen. De Wikimedia Foundation stelt echter dat deze praktijk onhoudbaar is. Het onderhouden van Wikipedia, de zevende meest bezochte website ter wereld, kostte $179 miljoen in het boekjaar 2023-2024. De stichting werkt voornamelijk op basis van donaties en is niet afhankelijk van advertentie-inkomsten, waardoor ze bijzonder kwetsbaar is voor verschuivingen in gebruikersgedrag.

Het probleem is niet alleen financieel; het gaat om toegang. Naarmate AI-chatbots zoals ChatGPT steeds vaker voorkomen, kunnen gebruikers Wikipedia volledig omzeilen en de donatieprompts overslaan die de site draaiende houden. Dit creëert een direct conflict tussen het vrije-toegangsmodel van Wikipedia en het winstgedreven karakter van AI-ontwikkeling.

De voorgestelde oplossing: commerciële API-toegang

Wikimedia stelt een oplossing voor: AI-bedrijven moeten betalen om de Enterprise API te gebruiken. Dit zou schaalbare toegang tot de inhoud van Wikipedia mogelijk maken zonder de servers van de non-profitorganisatie te overweldigen. De API zou ook een inkomstenstroom opleveren, ter ondersteuning van de missie van de stichting: vrije kennisverspreiding.

Het voorstel is niet nieuw. Google sloot in 2022 een soortgelijke commerciële deal met Wikimedia, wat de levensvatbaarheid van betaalde toegang tot gestructureerde kennis aantoont. De meeste grote AI-spelers – waaronder OpenAI, Meta, Anthropic, DeepSeek en xAI – moeten echter nog reageren op het verzoek van Wikimedia.

Een bredere trend: makers van inhoud gaan achteruit

Het standpunt van Wikimedia sluit aan bij een groeiende beweging onder makers van online inhoud die compensatie eisen voor het gebruik van AI-data. Uitgevers als de New York Times en News Corp klagen actief AI-bedrijven aan wegens inbreuk op het auteursrecht, terwijl anderen, zoals Associated Press en Reuters, over licentieovereenkomsten hebben onderhandeld. Dit weerspiegelt een fundamentele spanning tussen het open-source-ethos van het vroege internet en het steeds meer gecommercialiseerde landschap van AI.

De stap van de Wikimedia Foundation onderstreept een cruciaal keerpunt: gratis data is niet langer gegarandeerd. Naarmate AI-modellen geavanceerder worden, zal de waarde van hoogwaardige, door mensen samengestelde informatie alleen maar toenemen. Dit zal AI-bedrijven onvermijdelijk dwingen rekening te houden met de kosten – zowel financieel als ethisch – die gepaard gaan met het vertrouwen op vrijelijk verzamelde gegevens.

Concluderend kan worden gezegd dat Wikipedia’s eis om betaling van AI-bedrijven niet alleen over zijn eigen voortbestaan ​​gaat. Het is een voorbode van een bredere afrekening in de AI-industrie, waar toegang tot gegevens steeds vaker een prijs zal hebben.