Нова модель штучного інтелекту Google дозволить людству розуміти дельфінів
Нова модель штучного інтелекту Google дозволить людству розуміти дельфінів

Нова модель штучного інтелекту Google дозволить людству розуміти дельфінів

Зрозуміти дельфінів

Дельфіни вже давно вважаються одними з найрозумніших істот на планеті. Вони демонструють здатність до навчання, взаємодії, розпізнавання себе у дзеркалі та колективної поведінки. Їхня складна система звуків – свистів, клацань і навіть "крякання" – довгий час лишалася загадкою для дослідників. Тепер, із застосуванням інструментів штучного інтелекту та смартфонів Pixel, з'явився шанс зробити реальний прорив, повідомляє 24 Канал з посиланням на Neowin.

Google активно інтегрує генеративний ШІ у свої продукти та сервіси, тож не дивно, що компанія долучилася до Wild Dolphin Project (WDP) – дослідницької ініціативи, яка з 1985 року вивчає атлантичних плямистих дельфінів, використовуючи ненав’язливі методи спостереження. Команда WDP накопичила величезну колекцію аудіо- та відеоматеріалів разом із детальними поведінковими нотатками. Одне з головних завдань дослідників – зрозуміти, як саме дельфіни використовують вокалізацію у соціальній взаємодії.

Деякі звуки за роки спостережень уже вдалося прив’язати до конкретної поведінки. Наприклад, дельфіни видають характерні "іменні" свисти для ідентифікації одне одного, а те, що вчені назвали "кряканням" часто супроводжує конфлікти. Проте щоб з'ясувати, чи ця комунікація сягає рівня мови, потрібне значно глибше занурення в аналіз.

Саме тут і вступає в гру DolphinGemma – модель на основі відкритих AI-моделей Google Gemma, які побудовані на тій же архітектурі, що й комерційні Gemini. Вона використовує технологію SoundStream, яка дозволяє перетворювати звуки дельфінів у формат, придатний для обробки штучним інтелектом. Отримавши звукове повідомлення, модель намагається передбачити наступний "токен" – акустичний елемент, що може нести значення для дельфінів. Принцип її роботи схожий на те, як LLM генерують текст для людей.

Очікується, що DolphinGemma допоможе виявити складні звукові патерни, які потенційно зможуть стати основою для формування спільного "словника" між людьми й дельфінами. У Google наголошують: вручну аналіз таких обсягів даних зайняв би десятиліття.

Ще одна перевага DolphinGemma – її оптимізація для роботи на смартфонах Pixel. У польових умовах команда WDP вже кілька років використовує пристрій під назвою CHAT (Cetacean Hearing Augmentation Telemetry) – аудіосистему, зібрану на базі Pixel 6. Цей гаджет дозволяє як записувати звуки, так і відтворювати синтетичні вокалізації, які можуть імітувати дельфінячі "слова" й таким чином розмовляти з дельфінами.

Пристрій системи CHAT зі смартфоном Pixel 9
Пристрій системи CHAT зі смартфоном Pixel 9 / Фото Google

Незабаром дослідники отримають нову версію CHAT, побудовану на Pixel 9. Очікується, що оновлення зможе одночасно обробляти глибокі нейромережеві моделі й алгоритми зіставлення шаблонів у реальному часі. Водночас команда не планує відразу транслювати результати роботи DolphinGemma у море – поточні дослідження з CHAT тривають паралельно.

Хоча ця ініціатива не обіцяє миттєвого перекладу дельфінячих звуків, вона прокладає шлях до базової взаємодії між видами. Так само як LLM відкрили нову еру у людській комунікації, DolphinGemma може стати першим кроком до розуміння мови інших інтелектуальних істот.

Google планує зробити модель відкритою для дослідників по всьому світу вже цього літа. Попри те, що вона навчалася на звуках атлантичних плямистих дельфінів, компанія припускає можливість адаптації моделі для аналізу вокалізацій інших видів китоподібних.

Теги по теме
Google Техно
Источник материала
loader
loader