Wikipedia richiede il pagamento alle società di intelligenza artificiale per l’utilizzo dei dati

12

La Wikimedia Foundation, l’organizzazione no-profit dietro Wikipedia, sta ora cercando attivamente un risarcimento da parte delle società di intelligenza artificiale (AI) che utilizzano i suoi dati per addestrare i loro modelli. Questa mossa rappresenta un cambiamento significativo nel modo in cui gli archivi di conoscenza online interagiranno con il settore dell’intelligenza artificiale in rapida espansione.

Il problema principale: raccolta dei dati e sostenibilità

Per anni, gli sviluppatori di intelligenza artificiale hanno fatto affidamento su set di dati disponibili pubblicamente, inclusi i vasti contenuti di Wikipedia modificati in modo collaborativo, per addestrare modelli linguistici di grandi dimensioni (LLM). Tuttavia, la Wikimedia Foundation sostiene che questa pratica è insostenibile. Il mantenimento di Wikipedia, il settimo sito web più visitato a livello globale, è costato 179 milioni di dollari nell’anno fiscale 2023-2024. La fondazione opera principalmente grazie alle donazioni e non fa affidamento sulle entrate pubblicitarie, il che la rende particolarmente vulnerabile ai cambiamenti nel comportamento degli utenti.

Il problema non è solo finanziario; si tratta di accesso. Man mano che i chatbot basati sull’intelligenza artificiale come ChatGPT diventano più diffusi, gli utenti possono ignorare completamente Wikipedia, saltando le richieste di donazione che mantengono a galla il sito. Ciò crea un conflitto diretto tra il modello di accesso gratuito sostenuto da Wikipedia e la natura orientata al profitto dello sviluppo dell’intelligenza artificiale.

La soluzione proposta: accesso API commerciale

Wikimedia propone una soluzione: le aziende di intelligenza artificiale dovrebbero pagare per utilizzare la sua API Enterprise. Ciò consentirebbe un accesso scalabile ai contenuti di Wikipedia senza sovraccaricare i server dell’organizzazione no-profit. L’API fornirebbe anche un flusso di entrate, sostenendo la missione della fondazione di libera diffusione della conoscenza.

La proposta non è nuova. Google ha stretto un accordo commerciale simile con Wikimedia nel 2022, dimostrando la fattibilità dell’accesso a pagamento alla conoscenza strutturata. Tuttavia, la maggior parte dei principali attori dell’IA – tra cui OpenAI, Meta, Anthropic, DeepSeek e xAI – devono ancora rispondere alla richiesta di Wikimedia.

Una tendenza più ampia: i creatori di contenuti si oppongono

La posizione di Wikimedia è in linea con un movimento crescente tra i creatori di contenuti online che chiedono un risarcimento per l’utilizzo dei dati dell’intelligenza artificiale. Editori come il New York Times e News Corp stanno attivamente facendo causa alle aziende di intelligenza artificiale per violazione del copyright, mentre altri, come Associated Press e Reuters, hanno negoziato accordi di licenza. Ciò riflette una tensione fondamentale tra l’etica open source della prima Internet e il panorama sempre più commercializzato dell’intelligenza artificiale.

La mossa della Wikimedia Foundation sottolinea un punto di svolta fondamentale: i dati gratuiti non sono più garantiti. Man mano che i modelli di intelligenza artificiale diventano più sofisticati, il valore delle informazioni di alta qualità e curate dall’uomo non potrà che aumentare. Ciò costringerà inevitabilmente le aziende di intelligenza artificiale a fare i conti con i costi, sia finanziari che etici, derivanti dall’affidarsi a dati raccolti liberamente.

In conclusione, la richiesta di pagamento di Wikipedia da parte delle società di intelligenza artificiale non riguarda solo la sua stessa sopravvivenza. È un presagio di una resa dei conti più ampia nel settore dell’intelligenza artificiale, dove l’accesso ai dati avrà sempre più un prezzo.