Google звинуватили в брехні щодо їхнього відео про штучний інтелект Gemini

8 грудня, 09:26, 2023

Google щойно анонсувала Gemini, свій найпотужніший набір моделей штучного інтелекту, а компанію вже звинуватили у брехні щодо його продуктивності.

У статті Bloomberg повідомляється, що Google спотворив потужність Gemini у нещодавньому відеоролику. Під час свого анонсу Google показало демонстраційне відео й оглядачка Пармі Олсон стверджує, що у відео продукт виглядав надзвичайно потужним — можливо, навіть занадто.

Шестихвилинне відео демонструє мультимодальні можливості Gemini (наприклад, розмовні підказки в поєднанні з розпізнаванням зображень). Здається, що Gemini розпізнає зображення швидко — навіть на картинці, де треба з’єднати крапки — і реагує протягом декількох секунд, а також відстежує пачку паперу в чашці та гру з м’ячем у реальному часі. Звісно, все це може робити людина, але це штучний інтелект, здатний розпізнавати й передбачати, що станеться далі, передає The Verge.

Але якщо натиснути на опис відео на YouTube, то Google містить важливе застереження:

Для цілей цієї демонстрації затримка була зменшена, а відповіді Gemini були скорочені для стислості.

Вакансії

Журналіст, автор історій про IT, бізнес та людей в MC.today MC.today

Senior/Lead Python Engineer Impressit, з/п 7000

Senior DevOps (Solutions Architect) Hygge Software

Java Developer Go Interactive, Віддалено

Саме це обурює Олсон. Згідно з її статтею, Google визнав, коли його попросили прокоментувати, що відеодемонстрація не відбувалася в реальному часі з голосовими підказками, а натомість використовувалися нерухомі кадри з необробленого матеріалу, а потім виписувалися текстові підказки, на які Gemini реагував.

Google не погоджується. На питання про правдивість демонстрації, компанія вказала на пост Оріола Віньялса, віцепрезидента з досліджень і керівника напрямку глибокого навчання в Google DeepMind (також співкерівника Gemini), в якому пояснюється, як команда створила відеоролик.

Усі підказки та результати роботи користувача у відео є справжніми, скороченими для стислості. Відео ілюструє, як може виглядати багаторежимний користувацький досвід, створений за допомогою Gemini. Ми створили його, щоб надихнути розробників.

Він додав, що команда надала Gemini зображення та тексти й попросила його відповісти, передбачивши, що буде далі.

Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0

We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP

— Oriol Vinyals (@OriolVinyalsML) December 7, 2023