/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2F4b238798bb6d76b66ea1b5cd738d3d53.jpg)
Илон Маск представил «думающие» модели Grok 3 и Grok 3 mini — конкурентов DeepSeek и OpenAI со «страшно умным» ИИ
/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2F5ba2bc755d4fcf5798f63c2324414b74.png)
Компания искусственного интеллекта Илона Маска выпустила свою последнюю флагманскую модель искусственного интеллекта Grok 3 — ответ xAI на модели мышления OpenAI и китайской DeepSeek, который продвигают как «страшно умный ИИ».
Отмечается, что для обучения Grok 3, xAI использовал огромный центр обработки данных в Мемфисе, который содержит около 200 000 графических процессоров. Сам Маск отмечал, что последняя модель была создана со «в 10 раз» большими вычислительными ресурсами, чем Grok 2, и с расширенным набором учебных данных, который якобы включает материалы судебных дел.
«Grok 3 на порядок мощнее, чем Grok 2», — заявил Маск во время презентации, которая транслировалась в понедельник. «Это ИИ, который максимально ищет правду, даже если эта правда иногда противоречит тому, что является политически корректным».
Grok 3 — не единственная модель, а целое семейство, которое также включает меньшую версию Grok 3 mini (она отвечает на вопрос быстрее, но может быть не такой точной). Сейчас доступны только отдельные модели в бета-версии, тогда как полноценный запуск обещают на понедельник.
Результаты тестов
По словам xAI, Grok 3 превосходит GPT-4o по тестам — включая AIME, оценивающий производительность модели по выборке математических вопросов, и GPQA, который оценивает модели с помощью задач по физике, биологии и химии уровня PhD. Ранняя версия Grok 3 также якобы получила конкурентоспособные результаты в тестах Chatbot Arena, которая противопоставляет различные модели искусственного интеллекта и собирает оценки пользователей на их ответы.
Две вариации Grok 3 — Grok 3 Reasoning и Grok 3 mini Reasoning — могут тщательно «продумывать» проблемы, подобно «моделям рассуждения», таким какo3-mini от OpenAI и R1 китайской DeepSeek. Модели рассуждений известны тем, что тщательно проверяют себя, прежде чем публиковать результаты, и это позволяет им избежать некоторых ловушек, на которых обычно «тормозят» стандартные.
Стартап Маска также смело утверждает, что Grok 3 Reasoning превосходит лучшую версию o3-mini — o3-mini-high — по нескольким популярным тестам, включая более новый математический тест под названием AIME 2025.
Доступность
Модели рассуждения, которые xAI продвигает как такие, что лучше всего справляются с запросами по математике, науке или программированию, будут доступны в веб-версии программы Grok или приложения iOS — для более сложных задач предусмотрены опции «Think» и «Big Brain» (последняя при этом привлекает «дополнительные вычисления»), также есть опция DeepSearch (глубокого поиска, вроде той, что недавно представила OpenAI).
Маск отметил, что некоторые «мысли» моделей рассуждений в программе будут скрыты, чтобы предотвратить дистилляцию — метод, который в настоящее время используется разработчиками моделей ИИ, чтобы заимствовать данные из других моделей. OpenAI недавно заподозрила, что именно таким образом обучалась модель DeepSeek, которая якобы взяла данные из ChatGPT.
Изначально доступ к Grok 3 получат владельцы подписки Premium+ на X, однако для расширенных функций теперь предлагается новый тарифный план под названием SuperGrok, который за $30 в месяц (или $300 в год), разблокирует дополнительные рассуждения и запросы DeepSearch, а также обеспечит создание неограниченного количества изображений.
Примерно через неделю Grok 3 (и предшественницы) получит «голосовой режим», а через несколько недель поступит в корпоративный API xAI вместе с функцией DeepSearch. Также Маск обещает, что через несколько месяцев откроет исходный код Grok 2.
«Наш подход заключается в том, что мы открываем исходный код последней версии, когда следующая будет полностью выпущена. Когда Grok 3 станет зрелым и стабильным, а это, вероятно, в течение нескольких месяцев, тогда мы запустим Grok 2 с открытым исходным кодом».
Источник: TechCrunch
/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2F5ba2bc755d4fcf5798f63c2324414b74.png)

