Длительное общение с людьми негативно влияет на чат-боты с ИИ: они "тупеют"

21 февраля, 15:48

Общение с искусственным интеллектом

Популярные чат-боты с искусственным интеллектом после длительного общения с людьми начинают делать больше ошибок, будто «тупеют» в процессе виртуального разговора.

Об этом свидетельствует новое исследование, проведенное Microsoft Research совместно с Salesforce, сообщает Windows Central.

Анализ более 200 тысяч разговоров с чат-ботами крупных языковых моделей демонстрирует, что суммарный уровень ошибок может вырасти более чем на 100%. Пользователи регулярно жалуются на «галлюцинации» и неверные ответы.

Новая научная работа подтверждает: даже самые умные нейросети нередко «теряются» в разговоре, когда задача разбивается на естественный диалог из нескольких реплик.

В ходе эксперимента эксперты изучили диалоги пользователей с ведущими чат-ботами, включая GPT-4.1, Gemini 2.5 Pro, Claude 3.7 Sonnet и DeepSeek R1.

Если при одиночных запросах такие модели демонстрируют практически 90% успешных ответов, то в длительных разговорах с уточнениями и дополнительными вопросами показатель падает до 65%. Иными словами, с усложнением контекста эффективность заметно снижается.

Исследователи обнаружили еще одно интересное явление — «раздувание ответов». В многоходовых диалогах ответы моделей становились длиннее на 20-300%.

Вместе с объемом росло и количество предположений и «галлюцинаций», которые затем закреплялись в контексте разговора и использовались как основа для дальнейших реплик.

При этом даже модели с расширенными токенами размышления, такие как OpenAI o3 и DeepSeek R1, не смогли полностью избежать этого эффекта.

Авторы подчеркивают, что резкое ухудшение качества в длинных беседах не означает, что модели «тупеют» в буквальном смысле — скорее, это указывает на их ограниченность в удержании и правильной интерпретации большого объема информации во время диалога.

Как отмечает Windows Central, такие особенности следует учитывать при использовании чат-ботов в продуктах, ориентированных на длительное взаимодействие с пользователем. Возможные ошибки и галлюцинации могут ввести людей в заблуждение, особенно если пользователь полагается на ИИ как источник точной и критически важной информации.

По состоянию на настоящее время ChatGPT занимает более 80% мирового рынка чат-ботов. Ближайшие соперники — Perplexity и Google Gemini. На них приходится доля в 15% от всех пользователей.

Сборная США по лыжной акробатике / © Associated Press

Читать новость полностью →

Больничный — это официальное подтверждение временной нетрудоспособности работника / © Pixabay

Читать новость полностью →

Стадион "Динамо" имени Валерия Лобановского / © ФК Динамо Киев

Читать новость полностью →

Когда Благовещение Пресвятой Богородицы 2026 года / © pexels.com

Читать новость полностью →

Источник материала

TSN

Поделиться сюжетом

Технологии

Наука Космос Гаджеты Игры Интернет Другие

Среди девяток спрятанное число 6: попытайтесь разгадать головоломку за 3 секунды

Gazeta UA

21 июля 2026

Почему кошки могут часами смотреть в окно: у них есть на это веская причина

TSN

3 дня назад

Озвучено оновлені ціни на яйця в Україні

AgroNews

27 июля 2026

GTA 6 устанавливает новый шокирующий рекорд: игрокам нужно спешить с активацией игры

Comments UA

3 дня назад

В океане найдено то, что пугает даже косаток, терзающих акул: что заставляет китов бежать

Фокус

31 минуту назад

Купить стеновые панели: советы перед покупкой для дома и бизнеса

Новости Украины

1 час назад

В Антарктиде действует бомба замедленного действия: высвобождает ртуть, копившуюся сотни лет

Фокус

3 дня назад

В Україні створили ультраранній сорт амаранту, який дозріватиме за 90 днів

AgroNews

3 дня назад

140 000 айтишников потеряли работу из-за ИИ: Monday.com, Microsoft, Meta сокращают персонал

Знай

27 июля 2026