Технологическая компания Meta, владеющая Facebook и Instagram, представила публике новую модель собственного искусственного интеллекта под названием Llama 3.1 405B. Ее создатели назвали "следующим поколением самой современной большой языковой модели с открытым кодом".
В сообщении, опубликованном на сайте ИИ, Meta утверждает, что разработка их специалистов является самой большой и мощной базовой моделью в мире среди доступных для всех пользователей. Создатели заявляют, что Llama 3.1 405B может конкурировать с OpenAI и Anthropic в общих знаниях, математических навыках и переводе с одного языка на другой. Индекс в ее названии указывает на то, что у модели есть 405 миллиардов параметров.
По словам руководителей Meta, в результате обучения на самых быстрых чипах из доступных на рынке Llama 3.1 405B смогла обойти конкурентов по результатам 150 тестов. Разработчики других популярных искусственных интеллектов сейчас не разглашают ключевые параметры своих моделей, но известно, что GPT-4 от OpenAI имеет около 1,5 триллиона параметров. Вместе с выпуском Llama 3.1 405B, Meta также представила обновленные версии других моделей Llama, содержащих 70 миллиардов и 8 миллиардов параметров соответственно.
В компании Meta заявили, что хотят при помощи Llama 3.1 дать каждому возможность максимально эффективно использовать возможности модели 405B. Среди предоставленных пользователям функций:
- вывод в режиме реального времени и пакетный вывод;
- контролируемая тонкая настройка;
- оценка вашей модели для вашего конкретного применения;
- постоянное предварительное обучение;
- поисково-дополненная генерация (RAG);
- вызов функции;
- генерация синтетических данных.
Все эти расширенные возможности стали доступны пользователям сразу. Разработчики также могут изучить расширенные рабочие процессы, такие как простое в использовании создание синтетических данных, следовать готовым инструкциям по дистилляции моделей и обеспечить бесперебойную RAG с помощью решений от партнеров, включая AWS, NVIDIA и Databricks. Кроме того, Groq оптимизировал вывод с малой задержкой для облачных развертываний, а Dell добилась аналогичной оптимизации для локальных систем.
Среди усовершенствований Llama 3.1 405B – расширенные возможности логического вывода, более широкая многоязычная поддержка и значительное увеличение длины контекста до 128K маркеров. В компании Meta заявили, что представленная модель будет использоваться в Meta AI – чатботе компании, работающем на разных платформах, включая Facebook, Messenger, Instagram и WhatsApp, а также на смарт-очках.
В своем блоге о представленном ИИ рассказал и глава компании Meta Марк Цукерберг. Он отметил, что искусственный интеллект должен оставаться доступным для всех желающих как инструмент с открытым кодом. Однако в компании не рассказали подробнее о доступности и развертывании модели. Llama 3.1 поставляется через сервис Meta AI. Для ее использования необходимо авторизироваться с помощью Facebook или Instagram. В Украине сервис пока недоступен.
Ранее OBOZ.UA рассказывал, как получить наиболее компетентные советы от ChatGPT.
Подписывайтесь на каналы OBOZ.UA в Telegram и Viber, чтобы быть в курсе последних событий.