/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F434%2F6b39e854d2e2974d73c5a43ea120b3b5.jpg)
Розробники та дослідники не оцінили "найрозумніший ШІ у світі" Ілона Маска - Grok 3
Ілон Маск представив Grok 3 — нову версію чат-бота від xAI, назвавши її "на порядок більш потужною" за попередню. Деякі дослідники штучного інтелекту та експерти протестували Grok 3, і їхні перші реакції виявилися змішаними.
Про це пише Business Insider.
Маск стверджує, що нова модель перевершує флагманський GPT-4o від OpenAI та конкуруючі ШІ-системи від Google, DeepSeek і Anthropic у ключових тестах з математики, науки та програмування.
"Ми щодня покращуємо моделі, і буквально протягом 24 годин ви побачите зміни", — заявив Маск під час трансляції у соцмережі X, де виступав разом із трьома інженерами xAI.
Андрій Карпаті, комп’ютерний науковець, співзасновник OpenAI та колишній керівник напрямку ШІ в Tesla, у своєму дописі в X зазначив, що Grok 3 успішно виконав завдання, зокрема пошук складної інформації у науковій роботі. Проте, як і OpenAI o1-pro, він мав труднощі з розв’язанням "хитрих" партій у хрестики-нулики.
"Загальне враження — це рівень приблизно o1-pro, випереджає DeepSeek-R1, хоча для точних висновків потрібні реальні оцінки", — додав Карпати, який отримав ранній доступ до Grok 3.
xAI також представила новий інструмент для Grok 3 під назвою DeepSearch. Він покликаний покращити дослідження, генерацію ідей та аналіз даних, а також пояснювати, як саме ШІ обробляє запити й формує відповіді. За даними Business Insider, стартап працював над цим інструментом ще з кінця минулого року.
Карпаті зазначив, що DeepSearch приблизно відповідає DeepResearch від Perplexity, що є непоганим результатом, але все ще поступається новій функції "Deep Research" від OpenAI, яка виглядає більш ґрунтовною та надійною.
Ітан Моллік, професор Уортонської бізнес-школи Пенсильванського університету, який досліджує ШІ, вважає, що хоча xAI швидко масштабується, Grok 3 не є беззаперечним лідером.
"Дуже міцна модель передового рівня, але не настільки, щоб відмовитися від використання ваших поточних аналогів", — написав Моллік у понеділок у LinkedIn.
Він додав, що хоча Grok 3 перевершує деякі моделі OpenAI у певних тестах, він не є явним лідером над OpenAI o3.
Гері Маркус, засновник Geometric Intelligence і давній критик ажіотажу навколо ШІ, поставився до запуску скептично.
"Ілон Маск обіцяв, що Grok 3 стане найрозумнішим штучним інтелектом в історії. Спойлер: це не так", — написав Маркус у Substack.

