Wikipedia verlangt von KI-Unternehmen Bezahlung für die Datennutzung

16

Die Wikimedia Foundation, die gemeinnützige Organisation hinter Wikipedia, sucht nun aktiv nach einer Entschädigung von Unternehmen der künstlichen Intelligenz (KI), die ihre Daten zum Trainieren ihrer Modelle nutzen. Dieser Schritt stellt eine bedeutende Veränderung in der Art und Weise dar, wie Online-Wissensspeicher mit der schnell wachsenden KI-Branche interagieren werden.

Das Kernproblem: Data Scraping und Nachhaltigkeit

Seit Jahren verlassen sich KI-Entwickler auf öffentlich verfügbare Datensätze – einschließlich der umfangreichen, gemeinsam bearbeiteten Inhalte von Wikipedia –, um große Sprachmodelle (LLMs) zu trainieren. Die Wikimedia Foundation argumentiert jedoch, dass diese Praxis nicht nachhaltig sei. Der Unterhalt von Wikipedia, der am siebthäufigsten besuchten Website weltweit, kostete im Geschäftsjahr 2023–2024 179 Millionen US-Dollar. Die Stiftung arbeitet hauptsächlich auf Spenden und ist nicht auf Werbeeinnahmen angewiesen, wodurch sie besonders anfällig für Veränderungen im Nutzerverhalten ist.

Das Problem ist nicht nur finanzieller Natur; es geht um den Zugang. Mit der zunehmenden Verbreitung von KI-Chatbots wie ChatGPT umgehen Benutzer Wikipedia möglicherweise vollständig und überspringen die Spendenaufforderungen, die die Website am Leben halten. Dies führt zu einem direkten Konflikt zwischen den Verfechtern des freien Zugangsmodells von Wikipedia und dem gewinnorientierten Charakter der KI-Entwicklung.

Die vorgeschlagene Lösung: Kommerzieller API-Zugriff

Wikimedia schlägt eine Lösung vor: KI-Unternehmen sollten für die Nutzung ihrer Enterprise API bezahlen. Dies würde einen skalierbaren Zugriff auf Wikipedia-Inhalte ermöglichen, ohne die Server der gemeinnützigen Organisation zu überlasten. Die API würde auch eine Einnahmequelle darstellen und die Mission der Stiftung der kostenlosen Wissensverbreitung unterstützen.

Der Vorschlag ist nicht neu. Google hat bereits 2022 einen ähnlichen kommerziellen Deal mit Wikimedia abgeschlossen und damit die Machbarkeit des kostenpflichtigen Zugangs zu strukturiertem Wissen demonstriert. Allerdings haben die meisten großen KI-Akteure – darunter OpenAI, Meta, Anthropic, DeepSeek und xAI – noch nicht auf die Anfrage von Wikimedia reagiert.

Ein breiterer Trend: Content-Ersteller drängen zurück

Die Haltung von Wikimedia steht im Einklang mit einer wachsenden Bewegung unter den Erstellern von Online-Inhalten, die eine Entschädigung für die Nutzung von KI-Daten fordern. Verleger wie die New York Times und News Corp verklagen aktiv KI-Firmen wegen Urheberrechtsverletzungen, während andere, wie Associated Press und Reuters, Lizenzverträge ausgehandelt haben. Dies spiegelt eine grundlegende Spannung zwischen dem Open-Source-Ethos des frühen Internets und der zunehmend kommerzialisierten KI-Landschaft wider.

Der Schritt der Wikimedia Foundation unterstreicht einen kritischen Wendepunkt: Kostenlose Daten sind nicht länger garantiert. Da KI-Modelle immer ausgefeilter werden, wird der Wert hochwertiger, von Menschen kuratierter Informationen nur noch zunehmen. Dies wird KI-Unternehmen unweigerlich dazu zwingen, mit den Kosten – sowohl finanziellen als auch ethischen – zu rechnen, die sich aus der Abhängigkeit von frei gesammelten Daten ergeben.

Zusammenfassend lässt sich sagen, dass es bei der Zahlungsforderung von Wikipedia an KI-Unternehmen nicht nur um das eigene Überleben geht. Dies ist ein Vorbote einer umfassenderen Entwicklung in der KI-Branche, in der der Zugriff auf Daten zunehmend seinen Preis haben wird.