/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F434%2F58e0b67494c93b975e37706cd62dfc58.jpg)
Піонери штучного інтелекту отримали нагороду Тюрінга
Двоє інноваційних вчених-комп’ютерників отримали нагороду Тюрінга 2024 року за свою роботу в навчанні з підкріпленням, дисципліні, в якій машини навчаються за допомогою підходу на основі винагороди методом проб і помилок, який дозволяє їм адаптуватися в обмеженому або динамічному середовищі.
Ендрю Г. Барто , почесний професор Массачусетського університету Амгерст; та Річард С. Саттон , професор Університету Альберти, розробив ключові алгоритми та теорії через серію фундаментальних робіт, починаючи з 1980-х років . Це включає в себе роботу над технікою підкріплення, що називається навчанням часових відмінностей ; пізніше цей дует опублікував академічний підручник під назвою Reinforcement Learning: An Introduction .
Шановний математик Алан Тюрінг (на фото вище), на честь якого названо Премію Тюрінга, також підготував статтю в 1950-х роках під назвою « Обчислювальна техніка та інтелект» , у якій ставилося під сумнів, чи можуть комп’ютери мислити, і торкався подібних концепцій щодо навчання на досвіді.
В останні роки навчання з підкріпленням привернуло більше уваги після того, як Google Deepmind використав цю техніку для створення ШІ, який переміг найкращих у світі гравців AlphaGo . А за останні кілька місяців китайська вискочка зі штучного інтелекту DeepSeek потрапила в заголовки газет завдяки своїй революційній моделі міркування R1, яка значною мірою спиралася на навчання з підкріпленням для створення більш економічно ефективних базових моделей.
/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F434%2F97c848a4cb3b6cb5c71e05ceee401825.jpg)
«Нобелівська премія з обчислювальної техніки»
Премію Тьюрінга, яку вручає Асоціація обчислювальної техніки (ACM), часто називають «Нобелівською премією з обчислювальної техніки». Однак сама Нобелівська премія вторгається в сферу обчислень, особливо навколо ШІ; Минулого року Джефф Хінтон і Джон Хопфілд отримали Нобелівську премію з фізики за свою роботу в галузі штучного інтелекту. Невдовзі за цим послідували Деміс Хассабіс і Джон Джампер із DeepMind, які отримали Нобелівську премію з хімії за роботу над AlphaFold .
«На розвиток навчання з підкріпленням надихнули різні галузі досліджень, починаючи від когнітивної науки та психології та закінчуючи неврологією, що заклало основу для деяких найважливіших досягнень у галузі штучного інтелекту та дало нам змогу краще зрозуміти, як працює мозок», — сказав у прес-релізі президент ACM Янніс Іоаннідіс . «Робота Барто і Саттон — це не сходинка, від якої ми зараз рухаємось далі. Навчання з підкріпленням продовжує розвиватися та пропонує великий потенціал для подальшого прогресу в обчислювальній техніці та багатьох інших дисциплінах. Це доречно, що ми вшановуємо їх найпрестижнішою нагородою в нашій галузі».
Серед інших видатних піонерів штучного інтелекту, які отримали нагороду Тюрінга, — головний науковець Meta з штучного інтелекту Ян ЛеКун , який отримав нагороду в 2018 році разом із Джеффом Хінтоном і Йошуа Бенгіо за роботу над глибокими нейронними мережами.
Барто та Саттон поділять грошовий приз у розмірі 1 мільйон доларів, який був наданий за підтримки Google.

