ШІ "людяніший" за нас? GPT-4.5 пройшов тест Тюрінга з результатом 73%

21 травня, 10:28

Дослідники з Каліфорнійського університету в Сан-Дієго заявили, що сучасні моделі штучного інтелекту вже здатні успішно проходити тест Тюрінга під час живого спілкування. Ба більше, у новому експерименті модель GPT-4.5 частіше здавалася людям “справжньою людиною”, ніж реальні учасники розмови.

ШІ навчився проходити тест Тюрінга краще за людей

Під час дослідження вчені використали складнішу версію класичного тесту Тюрінга. Судді одночасно спілкувалися в чаті з людиною та ШІ-моделлю, не знаючи, хто є ким. Після короткої живої бесіди їм потрібно було визначити, де реальна людина, а де програма.

Результат виявився доволі несподіваним. GPT-4.5 у 73% випадків переконувала співрозмовників, що по той бік екрана сидить людина. Інша модель — LLaMa-3.1-405B — також показала високий результат і отримала “людський” статус у 56% випадків.

Особливо цікаво, що моделі не використовували голос, відео чи будь-які візуальні елементи. Вони працювали лише через текстове спілкування. Для успіху їм вистачило правильної манери відповідей, соціальних сигналів і природного стилю діалогу.

Сам тест Тюрінга існує вже десятки років. Його створили як спосіб перевірити, чи може машина настільки добре імітувати людину в розмові, щоб співрозмовник не помітив різниці. У класичному форматі оцінювач спілкується з учасниками “наосліп”, а потім намагається визначити, де людина, а де комп’ютер.

Дослідники наголошують, що отримані результати не означають, що ШІ отримав свідомість, емоції чи самосвідомість. Моделі просто навчилися дуже переконливо відтворювати людське спілкування під час коротких діалогів. Але саме це вже створює нові ризики.

Проблема може проявитися в повсякденних сервісах — службах підтримки, соцмережах, застосунках для знайомств, онлайн-навчанні чи навіть політичних кампаніях. У багатьох випадках люди ухвалюють рішення про довіру буквально за кілька повідомлень, і тепер чат-боти можуть успішно видавати себе за реальних співрозмовників.

Автори дослідження вважають, що наступним великим питанням стане обов’язкове маркування ШІ у чатах і цифрових сервісах. Якщо бот уже може “зливатися” зі звичайною розмовою, користувачам потрібні чіткі сигнали про те, що вони спілкуються саме з програмою, а не з людиною.

Спецпроєкти

Фактично дослідження показує новий етап розвитку генеративного ШІ. Моделі ще не “мислять” як люди, але вже навчилися дуже добре імітувати людську поведінку в реальному спілкуванні — і саме це може кардинально змінити онлайн-комунікацію в найближчі роки.

Джерело: digitaltrends

Джерело матеріала

ITC

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Планета перетворилася на гігантську піч: названо нову причину загибелі динозаврів

GlavRed

1 хвилину тому

Final Fantasy XIV виходить на Nintendo Switch 2 у серпні: гратимуть без підписки Nintendo

Знай

58 хвилин тому

Доведеться змінювати стратегію. Amazon згортає більшість своїх флагманських моделей штучного інтелекту

InternetUA

2 години тому

Ексклюзивні застосунки для Galaxy: що вони вміють і де їх знайти

InternetUA

3 години тому

Стали відомі головні зміни майбутнього MacBook Pro

InternetUA

4 години тому

Світло замість електрики. Науковці з Мічигану розробили новий спосіб управління електронами

InternetUA

4 години тому

Як зрозуміти, що USB-C кабель підтримує швидке заряджання

InternetUA

5 годин тому

ChatGPT почав відхиляти запити на створення текстів у стилі відомих авторів, — Ars Technica

Детектор М

5 годин тому

Який смартфон краще купити у 2026 році: Samsung Galaxy Z Fold 8 проти Oppo Find N6

Фокус

5 годин тому