Медіакомпанії придумали, як захистити себе від безкоштовного збору даних AI
Медіакомпанії придумали, як захистити себе від безкоштовного збору даних AI

Медіакомпанії придумали, як захистити себе від безкоштовного збору даних AI

На тлі фінансової кризи у медіа-індустрії кілька великих онлайн-майданчиків вирішили впровадити новий стандарт ліцензування Really Simple Licensing (RSL). Його завдання – встановити прозорі правила для компаній зі сфери штучного інтелекту, які збирають матеріали для навчання моделей. Про це повідомляє 24 Канал із посиланням на Engadget.

Що таке RSL і чому його підтримали великі платформи?

RSL інтегрується в протокол robots.txt і дозволяє публікаторам визначати, на яких умовах AI-компанії можуть використовувати їхній контент. Доступні опції включають безкоштовне використання з атрибуцією, підписку, оплату за кожен скрейп або навіть модель "pay-per-inference", де гроші сплачуються лише тоді, коли контент використано для відповіді моделі.

Запуск RSL супроводжується створенням керівної некомерційної організації – RSL Collective, яку очолюють колишній CEO Ask.com Даг Лідс і співзасновник RSS Еккарт Вальтер. Колектив бачить себе аналогом ASCAP і BMI, що управляють авторськими правами у музичній сфері.

До ініціативи вже приєдналися Reddit, Yahoo, People Inc., Medium, wikiHow, Ziff Davis, The Daily Beast, Ranker, Raptive, O’Reilly Media та інші видавці. Reddit CEO Стів Гаффман підкреслив, що стандарт допоможе зберегти відкритий веб і захистити онлайн-спільноти.

Попри амбітні заяви, залишається питання: чи будуть AI-компанії дотримуватися RSL. Раніше вони часто ігнорували robots.txt, однак ініціатори переконані, що новий протокол можна зробити юридично обов’язковим. Як аргумент Лідс навів приклад зі справою Anthropic, де йшлося про 1,5 мільярда доларів компенсації за несанкціоноване навчання ШІ, хоча остаточне рішення ще не прийнято.

Технічне забезпечення ініціативи бере на себе хмарна компанія Fastly, яка виступатиме своєрідним "фейс-контролем" для ботів. У майбутньому до процесу може долучитися й Cloudflare, що вже тестує власну систему "pay-per-crawl".

Організатори вважають, що RSL вигідний і самим AI-розробникам: він дозволяє укладати масштабні угоди замість численних локальних контрактів і легально використовувати контент із найкращих джерел. Це знижує ризик "галюцинацій" у відповідях моделей і створює прозору систему оплати – якщо контент використано, за нього платять, якщо ні – витрат немає.

Як АІ корпорації з медіакомпаніями?

Наприклад, OpenAI на початку цього року оголосила про укладення партнерства на три роки з виданням Axios. У рамках цієї угоди, компанія, що займається розробкою штучного інтелекту, профінансує розширення мережі місцевих інформаційних бюлетенів Axios. Нові філії будуть відкриті у містах Піттсбург (штат Пенсильванія), Канзас-Сіті (Міссурі), Боулдер (Колорадо) та Хантсвілл (Алабама).

Ця співпраця є унікальною для OpenAI, адже це перший випадок, коли компанія фінансує безпосередньо редакційну діяльність медіапартнера. Раніше OpenAI уклала угоди про ліцензування контенту з багатьма виданнями, такими як Vox Media, The Atlantic та Financial Times. Однак деталі цих угод не розголошувалися, а самі вони не передбачали інвестицій у розвиток видань.

Теги за темою
Техно Інтернет
Джерело матеріала
loader
loader