Новый тест для искусственного интеллекта не проходит ни одна модель ИИ

25 марта, 17:48, 2025

Фонд Arc Prize Foundation выпустил новый тест для проверки способностей ИИ по сравнению с человеком под названием ARC-AGI-2 и объявил приз в $700 тысяч создателям первых пяти моделей, которые получат в этом тесте рейтинг в 85% или выше.

Информация опубликована на сайте фонда.

В отличие от других тестов, которые проверяют ИИ на специализированные знания или сверхточные вопросы, невозможные для людей, ARC-AGI-2 использует задания, простые для людей, но сложные для ИИ.

В тестах каждое задание решали как минимум 2 человека за 2 попытки (или меньше) в контролируемом исследовании с участием четырех сотен людей, поэтому каждая модель ИИ также получила всего две попытки.

Исследователи фонда обнаружили, что системам искусственного интеллекта трудно интерпретировать значение символов, которое выходит за пределы их визуального вида.

Системы пытались проверять симметрию, зеркальное отражение, трансформации и даже распознавали соединительные элементы, но не смогли определить значение самих символов.

Также ИИ тяжело дается выполнение заданий, которые требуют одновременного применения правил или применения нескольких правил, которые взаимодействуют между собой.

Если правила заданий должны изменяться в зависимости от контекста, современный искусственный интеллект тоже не справится с задачей.

Заметим, что несмотря на то, что каждые 2 человека в группах тестирования всегда вместе проходили тест полностью, средний результат для одного человека - 60%.

Cloudflare создала ИИ для обмана ботов, которые собирают информацию для ИИ.

net в Telegram и Whats.

me/korrespondentnet и Whats.

Теги по теме

Технологии тесты

Источник материала

Корреспондент

Поделиться сюжетом

Технологии

Наука Космос Гаджеты Игры Интернет Другие

Среди девяток спрятанное число 6: попытайтесь разгадать головоломку за 3 секунды

Gazeta UA

21 июля 2026

ЕС собирается штрафовать за сокрытие использования искусственного интеллекта: подробности жесткого закона

Новости Украины

21 час назад

Почему кошки могут часами смотреть в окно: у них есть на это веская причина

TSN

28 июля 2026

Озвучено оновлені ціни на яйця в Україні

AgroNews

27 июля 2026

ТОП-6 ИИ-навыков, которые требуют работодатели: как оставаться востребованным специалистом

Comments UA

14 минут назад

СМИ: Microsoft готовится усилить экосистему Xbox на ПК — чего стоит ждать игрокам

GameMag

35 минут назад

Что делают китовые акулы под водой, когда их никто не видит: такого никогда не видели

Фокус

26 июля 2026

Ученые обнаружили удивительное морское животное там, где его никогда не видели

Фокус

26 июля 2026

Circana: 73% покупателей PlayStation 5 в США выбрали консоль с дисководом, но продажи физических версий игр продолжают падать

GameMag

26 июля 2026