Google тренує свої ШІ-моделі на відео з YouTube без дозволу авторів, — CNBC

20 июня, 16:52

У компанії кажуть, що йдеться лише про частину контенту й в межах угод із творцями та медіакомпаніями.

Google використовує відео з бібліотеки YouTube для навчання своїх моделей штучного інтелекту, таких як Gemini та генератор відео й аудіо Veo 3, без згоди авторів. Про це повідомляє CNBC із посиланням на джерела.

Один зі співрозмовників видання розповів, що для тренування застосовують каталог, який налічує 20 мільярдів роликів. У Google підтвердили цю інформацію, однак уточнили, що йдеться лише про частину контенту й у межах угод із творцями та медіакомпаніями.

Представник YouTube сказав, що компанія завжди використовувала власний контент для вдосконалення сервісів, і поява генеративного ШІ цього не змінила. За його словами, команда YouTube усвідомлює важливість захисту прав творців, тому розробила надійні механізми для їхньої безпеки.

Проте експерти, з якими спілкувалося CNBC, вважають, що використання чужих відео для тренування ШІ без відома їхніх творців може спричинити кризу в галузі інтелектуальної власності. Хоч YouTube каже, що раніше розповідав про це, творці контенту не завжди розуміють, що Google навчає свої моделі штучного інтелекту, використовуючи власну відеотеку.

YouTube не повідомив, скільки з 20 мільярдів відео на платформі використовуються для навчання ШІ. Але навчання лише на 1% каталогу становитиме 2,3 мільярда хвилин контенту, що, за словами експертів, більш ніж у 40 разів перевищує навчальні дані, що використовуються конкурентними моделями ШІ.

«Цілком можливо, що вони беруть дані від великої кількості авторів, які витратили багато часу, зусиль і власних ідей на створення цих відео. Це допомагає моделі Veo 3 створювати синтетичну версію — погану імітацію — цих авторів. І це не справедливо щодо них», — сказав Люк Арігоні — генеральний директор компанії Loti, яка займається захистом цифрової ідентичності творців.

CNBC поспілкувався з кількома провідними авторами контенту та фахівцями з інтелектуальної власності — жоден із них не знав і не був поінформований YouTube про те, що їхній контент можуть використовувати для навчання ШІ-моделей компанії Google.

За даними YouTube, щодня на платформу завантажується в середньому 20 мільйонів відео — як незалежними творцями, так і практично всіма великими медіакомпаніями. Завантажуючи відео на платформу, користувач погоджується з тим, що YouTube отримує широкі права на цей контент.

Організації, які захищають цифрові права, вважають, що праця творців використовується для розробки ШІ без їхньої згоди чи компенсації. Наприклад, сервіс Trace ID від компанії Vermillio показує, що деякі ШІ-ролики мають до 90% схожості з оригінальним контентом.

Водночас деякі автори контенту в коментарі CNBC сказали, що позитивно сприймають можливість використання їхнього контенту для Veo 3, оскільки вважають це «неминучим».

Нагадаємо, нещодавно компанії Disney та Universal подали позов до суду проти стартапу Midjourney, звинувативши його генератор зображень на основі штучного інтелекту в порушенні авторських прав.

Фото: Unsplash

ГО «Детектор медіа» понад 20 років бореться за кращу українську журналістику. Ми стежимо за дотриманням стандартів у медіа. Захищаємо права аудиторії на якісну інформацію. І допомагаємо читачам відрізняти правду від брехні.
До 22-річчя з дня народження видання ми відновлюємо нашу Спільноту! Це коло активних людей, які хочуть та можуть фінансово підтримати наше видання, долучитися до генерування ідей та створення якісних матеріалів, просувати свідоме медіаспоживання і разом протистояти російській дезінформації.

Долучитись

Теги по теме

Google

Источник материала

Детектор М

Поделиться сюжетом