Wikimedia Foundation, некомерційна організація, що стоїть за Wikipedia, зараз активно вимагає компенсації від компаній штучного інтелекту (AI), які використовують її дані для навчання своїх моделей. Цей крок знаменує значну зміну в тому, як онлайн-сховища знань будуть взаємодіяти з індустрією ШІ, що швидко розвивається.
Ключове питання: Збір даних і сталість
Протягом багатьох років розробники штучного інтелекту покладалися на загальнодоступні набори даних, включно з масивним, спільно редагованим вмістом Вікіпедії, щоб навчати великі мовні моделі (LLM). Проте Фонд Вікімедіа стверджує, що така практика є нежиттєздатною. Управління Вікіпедією, сьомим за відвідуваністю веб-сайтом у світі, коштувало 179 мільйонів доларів у фінансовому році 2023-24. Фонд працює переважно за рахунок пожертвувань і не покладається на доходи від реклами, що робить його особливо вразливим до змін у поведінці користувачів.
Проблема не лише фінансова; мова йде про доступ. Оскільки чат-боти штучного інтелекту, такі як ChatGPT, стають все більш поширеними, користувачі можуть повністю відмовитися від Вікіпедії, ігноруючи запити про пожертвування, які тримають сайт на плаву. Це створює прямий конфлікт між моделлю вільного доступу, яку пропагує Вікіпедія, і прибутковим характером розробки ШІ.
Пропоноване рішення: доступ до комерційного API
Wikimedia пропонує рішення: компанії зі штучним інтелектом повинні платити за використання свого Enterprise API. Це дозволить масштабований доступ до вмісту Вікіпедії без перевантаження серверів некомерційної організації. API також забезпечить потік доходу, підтримуючи місію фонду з поширення безкоштовних знань.
Пропозиція не нова. Google уклав подібну комерційну угоду з Wikimedia ще в 2022 році, продемонструвавши життєздатність платних систем для структурованих знань. Однак більшість основних гравців ШІ, включаючи OpenAI, Meta, Anthropic, DeepSeek і xAI, ще не відповіли на запит Wikimedia.
Більш широка тенденція: творці контенту відступають
Позиція Wikimedia узгоджується зі зростаючим рухом серед творців онлайн-контенту, які вимагають компенсації за використання даних ШІ. Такі видавці, як The New York Times і News Corp, активно судяться з компаніями штучного інтелекту за порушення авторських прав, тоді як інші, такі як Associated Press і Reuters, уклали ліцензійні угоди. Це відображає фундаментальну напругу між етикою відкритого коду раннього Інтернету та все більш комерціалізованим ландшафтом ШІ.
Дії Фонду Вікімедіа підкреслюють критичний поворотний момент: безкоштовні дані більше не гарантуються. У міру вдосконалення моделей штучного інтелекту цінність високоякісної інформації, підготовленої людьми, лише зростатиме. Це неминуче змусить компанії штучного інтелекту враховувати витрати — як фінансові, так і етичні — використання вільно зібраних даних.
Підсумовуючи, потрібно сказати, що Вікіпедія вимагає оплати від компаній ШІ не лише для її власного виживання. Це передвісник ширшого перегляду індустрії штучного інтелекту, де доступ до даних буде коштувати грошей.
