Розробники та дослідники не оцінили "найрозумніший ШІ у світі" Ілона Маска - Grok 3

20 февраля, 20:28

Ілон Маск представив Grok 3 — нову версію чат-бота від xAI, назвавши її "на порядок більш потужною" за попередню. Деякі дослідники штучного інтелекту та експерти протестували Grok 3, і їхні перші реакції виявилися змішаними.

Про це пише Business Insider.

Маск стверджує, що нова модель перевершує флагманський GPT-4o від OpenAI та конкуруючі ШІ-системи від Google, DeepSeek і Anthropic у ключових тестах з математики, науки та програмування.

"Ми щодня покращуємо моделі, і буквально протягом 24 годин ви побачите зміни", — заявив Маск під час трансляції у соцмережі X, де виступав разом із трьома інженерами xAI.

Андрій Карпаті, комп’ютерний науковець, співзасновник OpenAI та колишній керівник напрямку ШІ в Tesla, у своєму дописі в X зазначив, що Grok 3 успішно виконав завдання, зокрема пошук складної інформації у науковій роботі. Проте, як і OpenAI o1-pro, він мав труднощі з розв’язанням "хитрих" партій у хрестики-нулики.

"Загальне враження — це рівень приблизно o1-pro, випереджає DeepSeek-R1, хоча для точних висновків потрібні реальні оцінки", — додав Карпати, який отримав ранній доступ до Grok 3.

xAI також представила новий інструмент для Grok 3 під назвою DeepSearch. Він покликаний покращити дослідження, генерацію ідей та аналіз даних, а також пояснювати, як саме ШІ обробляє запити й формує відповіді. За даними Business Insider, стартап працював над цим інструментом ще з кінця минулого року.

Карпаті зазначив, що DeepSearch приблизно відповідає DeepResearch від Perplexity, що є непоганим результатом, але все ще поступається новій функції "Deep Research" від OpenAI, яка виглядає більш ґрунтовною та надійною.

Ітан Моллік, професор Уортонської бізнес-школи Пенсильванського університету, який досліджує ШІ, вважає, що хоча xAI швидко масштабується, Grok 3 не є беззаперечним лідером.

"Дуже міцна модель передового рівня, але не настільки, щоб відмовитися від використання ваших поточних аналогів", — написав Моллік у понеділок у LinkedIn.

Він додав, що хоча Grok 3 перевершує деякі моделі OpenAI у певних тестах, він не є явним лідером над OpenAI o3.

Гері Маркус, засновник Geometric Intelligence і давній критик ажіотажу навколо ШІ, поставився до запуску скептично.

"Ілон Маск обіцяв, що Grok 3 стане найрозумнішим штучним інтелектом в історії. Спойлер: це не так", — написав Маркус у Substack.

Источник материала

InternetUA

Поделиться сюжетом

Технологии

Наука Космос Гаджеты Игры Интернет Другие

"Это просто безумие": Журналисты пожаловались на резкое снижение интереса к контенту про Xbox — Steam Deck популярнее

GameMag

1 час назад

В Rockstar Games рассматривали возможность создания Grand Theft Auto с местом действия в России

GameMag

3 часа назад

Солнечные панели пора нести на свалку: ученые выяснили, что их разрушает. Открытие поразило

Фокус

6 часов назад

Китайские середняки с батареями 6500 мАч: что умеют смартфоны серии Huawei Nova 15

Фокус

6 часов назад

Головоломка для супер сообразительных: найдите число 623 всего за 32 секунды

GlavRed

6 часов назад

Новый Xiaomi 17 Ultra снимает лучше iPhone и Samsung: результаты уже в сети

Фокус

7 часов назад

Эту настройку важно поменять в новом смартфоне: что необходимо сделать после покупки

Фокус

7 часов назад

Японские разработчики пришли в восторг от Clair Obscur: Expedition 33 — любимая игра деятелей индустрии в 2025 году

GameMag

8 часов назад

Смартфон с функциями флагмана по умеренной цене: обзор необычной модели

Фокус

8 часов назад