Google написав «Конституцію роботів»
Google написав «Конституцію роботів»

Google написав «Конституцію роботів»

Команда робототехніки DeepMind показала три нові досягнення, які, за її словами, допоможуть роботам приймати швидші, кращі та безпечніші рішення в дикій природі. Один із них включає систему для збору тренувальних даних за допомогою «конституції робота», щоб переконатися, що ваш робот-помічник офісу може принести вам більше паперу для принтера — але без того, щоб скошувати людину-колегу, яка випадково опинилася на шляху.

Система збору даних Google, AutoRT, може використовувати візуальну мовну модель (VLM) і велику мовну модель (LLM), які працюють рука об руку, щоб зрозуміти середовище, адаптуватися до незнайомих налаштувань і вирішити відповідні завдання. Конституція робота, натхненна «Трьома законами робототехніки» Айзека Азімова, описується як набір «підказок, орієнтованих на безпеку», які інструктують LLM уникати вибору завдань, пов’язаних із людьми, тваринами, гострими предметами та навіть електричними приладами.

Для додаткової безпеки DeepMind запрограмував роботів на автоматичну зупинку, якщо сила, яка діє на його суглоби, перевищує певний поріг, і включив фізичний вимикач, за допомогою якого оператори можуть їх деактивувати. Протягом семи місяців компанія Google розгорнула парк із 53 роботів AutoRT у чотирьох різних офісних будівлях і провела понад 77 000 випробувань. Деякими роботами дистанційно керували люди-оператори, тоді як інші працювали або на основі сценарію, або повністю автономно за допомогою моделі навчання AI від Google Robotic Transformer (RT-2) .

У прикладі, наведеному в дописі, VLM AutoRT бачить стільницю з губкою та тканиною на ній, а також інші окремі предмети поблизу, такі як пакет з чіпсами та серветка.  Тоді LLM робота пропонує такі завдання, як покласти серветку на стіл і відкрити пакет з чіпсами.
AutoRT виконує ці чотири кроки для кожного завдання.

Роботи, використані в тесті, виглядають більше утилітарно, ніж кричущо — оснащені лише камерою, рукою робота та мобільною базою. «Для кожного робота система використовує VLM, щоб зрозуміти його оточення та об’єкти в межах видимості. Далі магістр пропонує список творчих завдань, які міг би виконати робот, наприклад «Поклади закуску на стільницю», і відіграє роль особи, яка приймає рішення, щоб вибрати відповідне завдання для виконання роботом», – зазначив Google. у своїй публікації в блозі. 

Інша нова технологія DeepMind включає SARA-RT, архітектуру нейронної мережі, розроблену, щоб зробити існуючий робот-трансформер RT-2 точнішим і швидшим. Він також анонсував RT-Trajectory, який додає 2D контури, щоб допомогти роботам краще виконувати певні фізичні завдання, такі як витирання столу. 

Здається, ми все ще дуже далекі від роботів, які автономно подають напої та пухнасті подушки, але коли вони доступні, вони, можливо, навчилися від такої системи, як AutoRT.

Джерело матеріала
loader
loader