/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F434%2F8c646ee53f6a6462f6384963c44d88fc.jpg)
ШІ перевершив людей у 44 професіях — звіт OpenAI
OpenAI протестувала ШІ у 44 професіях: Claude Opus 4.1 перевершив людей у майже половині завдань, а в окремих — навіть на 81%.
У звіті OpenAI, розробника ChatGPT, представлено результати тестування штучного інтелекту (ШІ) у 44 професіях, де він суттєво перевершує людей у виконанні певних завдань.
У тесті GDPval експерти оцінювали анонімні результати роботи ШІ та фахівців, не знаючи, хто з них створив той чи інший продукт. Найефективніша модель — Claude Opus 4.1 від компанії Anthropic — перевищила середній рівень професіоналів у 47,6% випадків, а в деяких професіях, як-от орендні агенти, досягала 81% переваги.
Значні ризики заміщення фіксуються у сферах роздрібної торгівлі, оптової торгівлі та держслужби, де ШІ перевершує людей у понад 50% завдань. Наприклад, «AI beats counter and rental clerks in 81% of tasks», — зазначено у звіті. Найбільш вразливими виявилися також менеджери з продажу (79%), редактори (75%) та програмісти (70%).
Водночас, деякі галузі, як-от індустрія інформації, залишаються відносно безпечними. Тут моделі ШІ, зокрема GPT-5-high, не досягають навіть 40% виграшів у завданнях, типових для журналістів або продюсерів. Це вказує на те, що не всі аспекти професійної діяльності можливо автоматизувати, особливо ті, що потребують творчого підходу та гнучкого мислення.
Хоча автори дослідження наголошують, що тест не охоплює весь спектр функцій професії, він демонструє потенціал ШІ у вирішенні конкретних робочих завдань. «Most jobs are more than just a collection of tasks that can be written down», — зауважують у OpenAI. Тобто, незважаючи на високі показники ефективності, ШІ поки що не може повністю замінити людину у комплексних професійних процесах.
Цікаво, що різні моделі ШІ демонструють різні сильні сторони. Claude Opus 4.1 частіше обирали завдяки візуально приємному оформленню, тоді як GPT-5-high був точнішим у технічних аспектах. Водночас GPT-4o, випущений лише 15 місяців тому, мав лише 12,4% успішності, що свідчить про швидку еволюцію можливостей ШІ.
«I’m confident that a lot of current customer support… will be better done by an AI», — зазначив Сем Альтман, керівник OpenAI. Проте компанія застерігає від паніки: головна мета — не заміна людини, а доповнення її роботи, підвищення ефективності і якості обслуговування.
Таким чином, результати дослідження свідчать про серйозний виклик для багатьох професій і потребу в адаптації людського капіталу до нової цифрової реальності.

