Жодна з нейромереж не змогла успішно пройти тест, розроблений організацією “Центр безпеки штучного інтелекту”.
Що ще відомо
Цей іспит, який називають “останнім тестом людства”, характеризується високою складністю і вимагає від ШІ відповідей на кілька тисяч запитань з таких дисциплін, як фізика, математика, хімія та інші наукові галузі. Чималу складність для нейромереж створюють численні допоміжні матеріали, які необхідно проаналізувати для знаходження правильних відповідей.
Творці тесту наголошують, що впоратися з ним може далеко не кожна людина, адже запитання ґрунтуються на матеріалах поглиблених університетських курсів. Найкращий результат серед ШІ продемонструвала оновлена версія ChatGPT, яка відповіла на 8,3% запитань, тоді як загальна кількість правильних відповідей серед усіх систем не перевищила 10%.