Meta запустила первые две модели Llama 4: мультимодальные, быстрые и мощные — еще две на подходе
Meta запустила первые две модели Llama 4: мультимодальные, быстрые и мощные — еще две на подходе

Meta запустила первые две модели Llama 4: мультимодальные, быстрые и мощные — еще две на подходе

Meta запустила первые две модели Llama 4: мультимодальные, быстрые и мощные — еще две на подходе - Фото 1

Meta представила первые две модели из мультимодального семейства Llama 4: Llama 4 Scout и Llama 4 Maverick. Всего в семействе будет четыре модели. Две из них уже запущены, а остальные появятся позже. По словам Meta, все они обучались на большом количестве неанотированного текста, изображений и видео, чтобы получить широкие возможности визуального понимания.

Причиной ускоренного запуска новых моделей стало успешное продвижение открытых моделей китайской лаборатории DeepSeek, которые работают на уровне или даже лучше предыдущих моделей Meta. Согласно сообщениям, Meta срочно организовала «военные комнаты», чтобы понять, как DeepSeek смогла снизить стоимость запуска и использования моделей типа R1 и V3.

По словам компании, Llama 4 Maverick — это «рабочая лошадка», которая лучше всего справляется с пониманием изображений и текста для «типичных задач ассистента и общения в чате». Зато модель Llama 4 Scout подходит для таких задач, как обобщение нескольких документов, анализ большого количества действий пользователя для персонализированных задач и логическая обработка объемных кодовых баз.

Meta также анонсировала Llama 4 Behemoth — будущую модель, которую компания называет «одной из самых умных ИИ-моделей в мире». Генеральный директор Марк Цукерберг добавил, что четвертая модель — Llama 4 Reasoning — будет представлена в течение следующего месяца.

Llama 4 Maverick и Scout уже доступны для загрузки на сайте Llama и на Hugging Face, а также уже интегрированы в Meta AI — в частности в WhatsApp, Messenger и Instagram (в сообщениях).

Технические характеристики Llama 4

Llama 4 Scout имеет 17 млрд активных параметров и 16 экспертов. По словам Цукерберга, эта модель «чрезвычайно быстрая» и нативно мультимодальная. Она имеет почти бесконечный контекст объемом до 10 млн токенов. При этом она разработана так, чтобы работать на одном графическом процессоре.

Llama 4 Maverick также имеет 17 млрд активных параметров, но уже 128 экспертов. Meta утверждает, что Maverick:

  • Превосходит GPT-4o, Gemini 2.0 в задачах по кодированию, логике, многоязычию, работе с длинным контекстом и изображениями;
  • Конкурирует с DeepSeek v3.1 по качеству логических рассуждений и кодирования.

Llama 4 Behemoth

Эта модель еще находится на этапе тренировки, но Meta уже заявляет, что это будет «самая мощная базовая модель в мире», с 288 млрд активных параметров. И хотя она еще не представлена, в ближайшее время стоит ожидать больше информации не только о ней.

Также можно ожидать раскрытия подробной информации о модели Llama 4 Reasoning. Ведь уже через несколько недель состоится большая конференция Meta для разработчиков ИИ — LlamaCon.

В январе 2025 года, в течение судебного процесса выяснилось, что Meta Марка Цукерберга для обучение ИИ Llama незаконно использовала миллионы книг.

Спецпроекты

Источник: techcrunch, engadget

Meta запустила первые две модели Llama 4: мультимодальные, быстрые и мощные — еще две на подходе - Фото 2
Источник материала
loader
loader