По сути, это голосовой чат-бот с расширенными возможностями.
Система использует продвинутые алгоритмы генеративного ИИ для общения с пользователем.
Помощник будет более индивидуальным и сможет адаптироваться к речи конкретного пользователя.
Gemini Live будет доступен подписчикам Gemini Advanced в ближайшие месяцы.
Ассистент Gemini Live использует мощные возможности платформы Gemini 1.5 с дополнительными ИИ-технологиями.
В частности, позднее в него интегрируют возможность работы с камерой.
Gemini Live сможет реагировать на окружение, воспринимая объекты через фотографии и видео прямо в режиме реального времени.
Аналогичные возможности демонстрирует новая версия GPT-4o от Open AI.
Gemini Live связан с другой разработкой компании под названием Project Astra.
Это многофункциональный мультимодальный помощник, который может смотреть и интерпретировать все, что видит через камеру вашего устройства.
Он сможет ориентироваться в пространстве и запоминать положение предметов.
@video=//www
Опубликована демонстрация, в которой Project Astra описывает разные предметы и элементы окружающего мира, а также помогает пользователю найти очки, указывая их местоположение.
The Verge.