в тому числі

26 листопада, 14:38, 2024

Сайт The Atlantic дослідив набір даних, який використовувався для навчання моделей ШІ, що належать Apple, Anthropic та Nvidia зокрема, і виявив, що побоювання працівників галузі щодо нової технології далеко небезпідставні.

У набір були включені елементи з щонайменше 53 000 фільмів та 85 000 серіалів: зокрема усі стрічки, номіновані на «найкращий фільм» протягом 1950-2016 років, близько 600 епізодів «Сімпсонів», 170 епізодів «Сайнфелда», 45 епізодів «Твін Пікс» та усі серії «Пуститися берега» і «Клану Сопрано». Так само набір даних містив «живі» діалоги з трансляцій «Золотого глобуса» і «Оскару».

The Atlantic зазначає, що тексти, представлені у наборі даних — не оригінальні сценарії, а субтитри, взяті з сайту OpenSubtitles.org. Користувачі зазвичай їх витягують з DVD, Blu-ray та стримінгів за допомогою програмного забезпечення оптичного розпізнавання символів, а далі завантажують на сайт (наразі там розміщено понад 9 мільйонів файлів із субтитрами на понад 100 мовах та діалектах).

Причому деякі компанії згадують використання субтитрів у своїх дослідницьких статтях: Anthropic навчала на них чатбота Claude, Meta — групу великих мовних моделей під назвою Open Pre-trained Transformer (OPT), Apple — LLM, які можуть працювати на iPhone, а Nvidia — NeMo Megatron LLM. Так само активно OpenSubtitles.org «юзали» Salesforce, Bloomberg, EleutherAI, Databricks, Cerebras та інші розробники ШІ.

Apple зазначила у коментарі, що її LLM призначені «виключно для досліджень», тоді як Salesforce наголосила, що набір даних «ніколи не використовувався для інформування чи покращення будь-яких пропозицій продуктів компанії». Решта згаданих у статті компаній, або відмовились від коментарів, або не відповіли на запити.

Питання щодо легальності використання даних для навчання штучного інтелекту залишається відкритим — з моменту «буму» текстових ботів після запуску ChatGPT. Прозорість компаній все ще досить низька і змусити їх розкрити дані, зможе хіба що суд — але, випадок з OpenAI, показав, що і ця інформація може раптово зникнути.

Спецпроєкти

Здається, сценарист «Пуститися берега» Вінс Ґілліґан щось знав, коли торік назвав генеративний штучний інтелект «надзвичайно складною та енергомісткою формою плагіату» — цікаво, як би він відреагував на те, що технологія вже на всю розпоряджається написаними ним діалогами?

Штучний інтелект використав понад 140 000 фільмів та серіалів для навчання — всі епізоди «Пуститися берега» та «Клану Сопрано» в тому числі - Фото 2

Теги за темою

Apple

Джерело матеріала

ITC

Поділитися сюжетом

Культура і розваги

Кіно Театр Музика та концерти Виставки та події Мода та стиль Шоу-бізнес Культурне життя

Білик заінтригувала. Співачка готує українську версію легендарного новорічного хіта

ГЛАВКОМ NET

3 дня тому

Спасибі Вам, маестро Гіга! Прощання з легендарним і загадковим артистом: репортаж зі Львова

ГЛАВКОМ NET

3 дня тому

Диван зачекає: куди піти у Києві на цьому тижні, 15 – 19 грудня

VGorode

3 дня тому

Не Різдвом єдиним: відома американська співачка виступить на відкритті Олімпіади

ГЛАВКОМ NET

3 дня тому

На концерті Макса Барського зникло світло. Як відреагував співак та що пишуть українці

ГЛАВКОМ NET

15 грудня 2025

Штучний інтелект використав понад 140 000 фільмів та серіалів для навчання — всі епізоди «Пуститися берега» та «Клану Сопрано» в тому числі

Культура і розваги

Білик заінтригувала. Співачка готує українську версію легендарного новорічного хіта

Спасибі Вам, маестро Гіга! Прощання з легендарним і загадковим артистом: репортаж зі Львова

Диван зачекає: куди піти у Києві на цьому тижні, 15 – 19 грудня

Не Різдвом єдиним: відома американська співачка виступить на відкритті Олімпіади

На концерті Макса Барського зникло світло. Як відреагував співак та що пишуть українці

Працівники Лувру оголосили страйк, музей закритий

Лувр не відкрився вчасно через обговорення співробітниками потенційного страйку

Голлівудського режисера Роба Райнера разом із дружиною знайдено мертвими

Ексбойфренд Олени Тополі прокоментував її розлучення

Культура і розваги

Білик заінтригувала. Співачка готує українську версію легендарного новорічного хіта

Спасибі Вам, маестро Гіга! Прощання з легендарним і загадковим артистом: репортаж зі Львова

Диван зачекає: куди піти у Києві на цьому тижні, 15 – 19 грудня

Не Різдвом єдиним: відома американська співачка виступить на відкритті Олімпіади

На концерті Макса Барського зникло світло. Як відреагував співак та що пишуть українці

Працівники Лувру оголосили страйк, музей закритий

Лувр не відкрився вчасно через обговорення співробітниками потенційного страйку

Голлівудського режисера Роба Райнера разом із дружиною знайдено мертвими

Ексбойфренд Олени Тополі прокоментував її розлучення