Тривале спілкування з людьми негативно впливає на чат-боти із ШІ: вони "тупішають"

21 лютого, 15:51

Спілкування із штучним інтелектом

Популярні чат-боти із штучним інтелектом після тривалого спілкування з людьми починають робити більше помилок, ніби «тупішають» у процесі віртуальної розмови.

Про це свідчить нове дослідження, проведене Microsoft Research спільно із Salesforce, повідомляє Windows Central.

Аналіз понад 200 тисяч розмов із чат-ботами великих мовних моделей демонструє, що сумарний рівень помилок може зрости більш ніж на 100%. Користувачі регулярно скаржаться на «галюцинації» і невірні відповіді.

Нова наукова робота підтверджує: навіть найрозумніші нейромережі нерідко «губляться» у розмові, коли завдання розбивається на природний діалог із кількох реплік.

Під час експерименту експерти вивчили діалоги користувачів із провідними чат-ботами, включно із GPT-4.1, Gemini 2.5 Pro, Claude 3.7 Sonnet та DeepSeek R1.

Якщо при одиночних запитах такі моделі демонструють практично 90% успішних відповідей, то у тривалих розмовах з уточненнями та додатковими питаннями показник падає до 65%. Іншими словами, з ускладненням контексту ефективність помітно знижується.

Дослідники виявили ще одне цікаве явище — «роздування відповідей». У багатоходових діалогах відповіді моделей ставали довшими на 20–300%.

Разом з обсягом зростала і кількість припущень та «галюцинацій», які потім закріплювалися в контексті розмови та використовувалися як основа для подальших реплік.

При цьому навіть моделі з розширеними токенами роздуми, такі як OpenAI o3 і DeepSeek R1, не змогли повністю уникнути цього ефекту.

Автори підкреслюють, що різке погіршення якості в довгих бесідах не означає, що моделі «тупішають» у буквальному значенні — швидше, це вказує на їхню обмеженість у утриманні та правильній інтерпретації великого обсягу інформації під час діалогу.

Як зазначає Windows Central, такі особливості слід враховувати під час використання чат-ботів у продуктах, орієнтованих на тривалу взаємодію з користувачем. Можливі помилки та галюцинації можуть ввести людей в оману, особливо якщо користувач покладається на ШІ як джерело точної та критично важливої інформації.

Станом на теперішній час ChatGPT займає понад 80% світового ринку чат-ботів. Найближчі суперники — Perplexity та Google Gemini. На них припадає частка у 15% від усіх користувачів.

Збірна США з лижної акробатики / © Associated Press

Читати публікацію повністю →

Лікарняний — це офіційне підтвердження тимчасової непрацездатності працівника / © Pixabay

Читати публікацію повністю →

Стадіон "Динамо" імені Валерія Лобановського / © ФК Динамо Київ

Читати публікацію повністю →

Коли Благовіщення Пресвятої Богородиці 2026 року / © pexels.com

Читати публікацію повністю →

Джерело матеріала

TSN

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Завдяки штучному інтелекту - Google у червні виправила більше помилок Chrome, ніж за останні два роки

InternetUA

6 хвилин тому

Науковці розробили метод запису даних у пам’ять із витратами енергії у десять разів нижчими за стандартні

InternetUA

3 години тому

У Китаї з'явився двійник Ілона Маска: що про нього відомо

ГЛАВКОМ NET

4 години тому

iPad Air вперше за сім років отримає новий дизайн

InternetUA

4 години тому

Тривале спілкування з людьми негативно впливає на чат-боти із ШІ: вони "тупішають"

Технології

Завдяки штучному інтелекту - Google у червні виправила більше помилок Chrome, ніж за останні два роки

Кнопкові телефони знову в моді: чому люди відмовляються від смартфонів

Вода допомогла майже вдвічі підвищити ефективність натрій-іонних батарей

Emirates оснастить літаки Airbus A350 швидкісним інтернетом Starlink

Apple збільшить обсяг оперативної пам’яті в доступному iPhone 18e

Магнітна буря 2 серпня: що відомо

Науковці розробили метод запису даних у пам’ять із витратами енергії у десять разів нижчими за стандартні

У Китаї з'явився двійник Ілона Маска: що про нього відомо

iPad Air вперше за сім років отримає новий дизайн

Технології

Завдяки штучному інтелекту - Google у червні виправила більше помилок Chrome, ніж за останні два роки

Кнопкові телефони знову в моді: чому люди відмовляються від смартфонів

Вода допомогла майже вдвічі підвищити ефективність натрій-іонних батарей

Emirates оснастить літаки Airbus A350 швидкісним інтернетом Starlink

Apple збільшить обсяг оперативної пам’яті в доступному iPhone 18e

Магнітна буря 2 серпня: що відомо

Науковці розробили метод запису даних у пам’ять із витратами енергії у десять разів нижчими за стандартні

У Китаї з'явився двійник Ілона Маска: що про нього відомо

iPad Air вперше за сім років отримає новий дизайн