La Fundación Wikimedia, la organización sin fines de lucro detrás de Wikipedia, ahora busca activamente una compensación de las empresas de inteligencia artificial (IA) que utilizan sus datos para entrenar sus modelos. Este movimiento representa un cambio significativo en la forma en que los repositorios de conocimiento en línea interactuarán con la industria de la IA en rápida expansión.
El problema central: extracción de datos y sostenibilidad
Durante años, los desarrolladores de IA han dependido de conjuntos de datos disponibles públicamente (incluido el vasto contenido editado en colaboración de Wikipedia) para entrenar grandes modelos de lenguaje (LLM). Sin embargo, la Fundación Wikimedia sostiene que esta práctica es insostenible. Mantener Wikipedia, el séptimo sitio web más visitado a nivel mundial, costó 179 millones de dólares en el año fiscal 2023-2024. La fundación opera principalmente con donaciones y no depende de los ingresos por publicidad, lo que la hace especialmente vulnerable a los cambios en el comportamiento de los usuarios.
El problema no es sólo financiero; se trata de acceso. A medida que los chatbots de IA como ChatGPT se vuelven más frecuentes, los usuarios pueden pasar por alto Wikipedia por completo, saltándose las indicaciones de donación que mantienen el sitio a flote. Esto crea un conflicto directo entre los defensores del modelo de acceso gratuito de Wikipedia y la naturaleza impulsada por las ganancias del desarrollo de la IA.
La solución propuesta: acceso a API comercial
Wikimedia propone una solución: las empresas de IA deberían pagar por utilizar su API empresarial. Esto permitiría un acceso escalable al contenido de Wikipedia sin saturar los servidores de la organización sin fines de lucro. La API también proporcionaría una fuente de ingresos, apoyando la misión de la fundación de difundir conocimientos de forma gratuita.
La propuesta no es nueva. Google cerró un acuerdo comercial similar con Wikimedia en 2022, lo que demuestra la viabilidad del acceso pago al conocimiento estructurado. Sin embargo, la mayoría de los principales actores de la IA (incluidos OpenAI, Meta, Anthropic, DeepSeek y xAI) aún no han respondido a la solicitud de Wikimedia.
Una tendencia más amplia: los creadores de contenido retroceden
La postura de Wikimedia se alinea con un movimiento creciente entre los creadores de contenido en línea que exigen una compensación por el uso de datos de IA. Editores como el New York Times y News Corp están demandando activamente a empresas de inteligencia artificial por infracción de derechos de autor, mientras que otros, como Associated Press y Reuters, han negociado acuerdos de licencia. Esto refleja una tensión fundamental entre el espíritu de código abierto de los inicios de Internet y el panorama cada vez más comercializado de la IA.
La medida de la Fundación Wikimedia subraya un punto de inflexión crítico: ya no se garantiza la gratuidad de los datos. A medida que los modelos de IA se vuelvan más sofisticados, el valor de la información de alta calidad seleccionada por humanos no hará más que aumentar. Esto inevitablemente obligará a las empresas de IA a tener en cuenta los costos (tanto financieros como éticos) de depender de datos obtenidos libremente.
En conclusión, la exigencia de pago de Wikipedia a las empresas de inteligencia artificial no se trata sólo de su propia supervivencia. Es un presagio de un ajuste de cuentas más amplio en la industria de la IA, donde el acceso a los datos tendrá cada vez más un precio.

































