Сайт позволяет найти книги, которые «спиратила» Meta для обучения ИИ Llama

24 марта, 18:22, 2025

В январе 2025 года, в течение судебного процесса процесс выяснилось, что Meta Марка Цукерберга для обучение ИИ Llama незаконно использовала миллионы книг. Теперь можно найти, какие конкретно.

Большие языковые модели ИИ требуют огромных наборов текстовых данных для обучения и воспроизведения точного соответствия слов в языке. На самом деле легальные оригинальные материалы для искусственного интеллекта становится трудно найти.

«У нас буквально заканчивается текст во Вселенной, на котором можно обучать эти системы», — сказал ученый-информатик Стюарт Рассел еще в 2023 году

Meta, материнская компания Facebook и Instagram, вынужденно приоткрыла завесу с того, как это делается на самом деле. Судебное дело выявило тот факт, что Meta незаконно загрузила известную пиратскую библиотеку LibGen, чтобы получить миллионы защищенных законом текстов. После того, программисты получили одобрение лично от Цукерберга, книги нелегально были переданы для обучения LLM. Так, одна из крупнейших компаний в мире не заплатила ни за одну копию этих книг.

Сайт The Atlantic создал поисковую систему, которая позволяет выявить в файлах LibGen, какие именно книги были использованы Meta. Речь идет о чрезвычайно большом объеме данных, которые охватывают более 7,5 млн книг, около 81 млн научных работ, а также другие произведения.

Иск возглавляли авторы Та-Нехиси Коутс и Сара Сильверман, которые имели представление о пиратстве данных в Meta благодаря предыдущему иску 2023 года. Новый инструмент поиска позволяет писателям и ученым увидеть, какая именно работа была «спирачена» корпорацией для обучения коммерческого ИИ.

«Моя книга здесь — и это хорошо! LibGen делает тексты доступными для людей, которые иначе не имели бы доступа. Проблема заключается не в том, что LibGen делает контент доступным бесплатно, а в том, что Meta крадет этот материал ради прибыли», — говорит автор Wired Джастин Линг.

Окончательное решение в продолжающемся процессе ожидается не раньше лета. Тем временем Llama работает и свободен на таких платформах, как Facebook, Instagram и WhatsApp. Это не единственный подобный процесс против крупной корпорации: год назад авторы судились с NVIDIA.

Спецпроекты

Источник: Futurism

Сайт позволяет найти книги, которые «спиратила» Meta для обучения ИИ Llama - Фото 2

Источник материала

ITC

Поделиться сюжетом

Упоминаемые персоны

Марк Цукерберг

Бизнесмен

5 упоминаний

Технологии

Наука Космос Гаджеты Игры Интернет Другие

Инопланетные цивилизации могут общаться как светлячки у всех на виду, считают ученые

Фокус

7 января 2026

У "Резерв+" появились уведомления о бумажных повестках: считается ли это официальным вручением

UAToday

7 января 2026

Держгеокадастр повідомив про індексацію нормативної грошової оцінки земель за 2025 р

AgroNews

30 минут назад

Когда дома нет отопления: топ 3 дешевых обогревателя, которые соргреют и не подведут

Фокус

33 минуты назад

Живой искусственный интеллект: как FinalSpark делает компьютер из нейронов мозга – интервью с СЕО

Лига

48 минут назад

Первые бесплатные игры января 2026 для подписчиков PS Plus Premium и Extra раскрыты раньше времени: Чем порадует Sony

GameMag

1 час назад

Сайт позволяет найти книги, которые «спиратила» Meta для обучения ИИ Llama

Технологии

Инопланетные цивилизации могут общаться как светлячки у всех на виду, считают ученые

У "Резерв+" появились уведомления о бумажных повестках: считается ли это официальным вручением

Мы излучаем свет, пока живы: ученые сделали шокирующее открытие

Майданчик УУБ – лідер 2025-го із підготовки учасників до земельних аукціонів

Космический полет меняет мозг человека неожиданным образом: что выяснили ученые

Держгеокадастр повідомив про індексацію нормативної грошової оцінки земель за 2025 р

Когда дома нет отопления: топ 3 дешевых обогревателя, которые соргреют и не подведут

Живой искусственный интеллект: как FinalSpark делает компьютер из нейронов мозга – интервью с СЕО

Первые бесплатные игры января 2026 для подписчиков PS Plus Premium и Extra раскрыты раньше времени: Чем порадует Sony

Технологии

Инопланетные цивилизации могут общаться как светлячки у всех на виду, считают ученые

У "Резерв+" появились уведомления о бумажных повестках: считается ли это официальным вручением

Мы излучаем свет, пока живы: ученые сделали шокирующее открытие

Майданчик УУБ – лідер 2025-го із підготовки учасників до земельних аукціонів

Космический полет меняет мозг человека неожиданным образом: что выяснили ученые

Держгеокадастр повідомив про індексацію нормативної грошової оцінки земель за 2025 р

Когда дома нет отопления: топ 3 дешевых обогревателя, которые соргреют и не подведут

Живой искусственный интеллект: как FinalSpark делает компьютер из нейронов мозга – интервью с СЕО

Первые бесплатные игры января 2026 для подписчиков PS Plus Premium и Extra раскрыты раньше времени: Чем порадует Sony