/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2F4ce81e58e2558212a7b7d11646aaf682.jpg)
Майбутнє автономних авто під загрозою — моделі ШІ виявилися соціопатами
/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2Fcfe3cfa8b5d78c727461bf7c3dfc3ab8.png)
Дослідження, проведене науковцями з Університету Джонса Хопкінса, продемонструвало, що люди перевершують ШІ у точному описі та інтерпретації соціальної взаємодії у динамічних умовах.
Зазначається, що це має вирішальне значення для таких технологій, як безпілотні транспортні засоби та роботи-помічники, які значною мірою орієнтуються на системи штучного інтелекту для безпечної навігації в реальних умовах. Автори дослідження підкреслюють, що існуючі моделі ШІ мають проблеми з розумінням нюансів соціальної динаміки та невербальних сигналів, необхідних для ефективної взаємодії з людьми. Результати дослідження вказують на те, що ці обмеження можуть бути викликані самою структурою сучасних моделей ШІ.
«Наприклад, ШІ у безпілотному автомобілі має розпізнавати наміри, цілі та дії водіїв та пішоходів. Ви б хотіли, щоб він знав, в який бік збирається піти пішохід, чи розмовляють двоє людей, чи збираються перейти вулицю. Щоразу, коли ви хочете, щоб ШІ взаємодіяв з людьми, ви хочете, щоб він міг розпізнавати, що роблять люди. Я думаю, це проливає світло на той факт, що ці системи не можуть цього робити прямо зараз», — пояснює провідна авторка дослідження, доцент кафедри когнітивних наук в Університеті Джонса Хопкінса, Лейла Ісік.
Щоб з’ясувати, наскільки моделі ШІ наближені до людського сприйняття, науковці змусили учасників дослідження переглянути короткі трисекундні відеоролики, у яких люди спільно та самостійно виконували різні завдання, демонструючи різні аспекти соціальної взаємодії. Учасників дослідження попросили оцінити важливі для розуміння соціальної взаємодії характеристики за шкалою від 1 до 5.
Після цього дослідники використали понад 350 великих мовних моделей, а також генеративні моделі ШІ, попросивши їх передбачити, як люди оцінюватимуть короткі відео і як вони на них відреагують. Окрім цього великі мовні моделі також попросили оцінити короткі субтитри, написані людиною до цих відео.
Більшість людей, що брали участь у дослідженні, дійшли згоди один з одним щодо всіх питань. Однак цього не сталось у випадку з моделями ШІ. Моделі, що призначені для генерації відео, не змогли скласти точний опис того, що роблять люди на відео. Навіть моделі для генерації зображень, які мали проаналізувати серію статичних кадрів, не змогли цілком передбачити, чи спілкувались між собою люди на відео, чи ні. Мовні моделі краще передбачували поведінку людини, тоді як відеомоделі краще передбачували нейронну активність мозку.
«Недостатньо просто побачити зображення та розпізнати об’єкти та обличчя. Це був перший крок, який просунув нас далеко вперед у розвитку ШІ. Але реальне життя не статичне. Нам потрібен ШІ, який розумітиме те, що відбувається перед ним. Розуміння відносин, контексту та динаміки соціальної взаємодії — це наступний крок, і це дослідження передбачає, що у розробці моделей ШІ може бути сліпа пляма», — зазначає співавтор дослідження, аспірантка Кеті Гарсія.
На думку дослідників, така ситуація склалась через те, що нейронні мережі ШІ були створені на базі тих частин людського мозку, що займаються обробкою статичних зображень. Вони значно відрізняються від областей мозку, які обробляють динамічну соціальну взаємодію.
Науковці дійшли висновку, що наразі жодна модель ШІ нездатна адекватно реагувати на людську поведінку у соціальному динамічному середовищі. Дослідники зазначають, що наявні моделі ШІ не мають якогось фундаментального аспекту, який дозволяє людському мозку безпомилково та швидко інтерпретувати аспекти динамічної соціальної взаємодії.
Джерело: SkiTechDaily
/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2Fcfe3cfa8b5d78c727461bf7c3dfc3ab8.png)

