Google щойно анонсувала Gemini, свій найпотужніший набір моделей штучного інтелекту, а компанію вже звинуватили у брехні щодо його продуктивності.
У статті Bloomberg повідомляється, що Google спотворив потужність Gemini у нещодавньому відеоролику. Під час свого анонсу Google показало демонстраційне відео й оглядачка Пармі Олсон стверджує, що у відео продукт виглядав надзвичайно потужним — можливо, навіть занадто.
Шестихвилинне відео демонструє мультимодальні можливості Gemini (наприклад, розмовні підказки в поєднанні з розпізнаванням зображень). Здається, що Gemini розпізнає зображення швидко — навіть на картинці, де треба з’єднати крапки — і реагує протягом декількох секунд, а також відстежує пачку паперу в чашці та гру з м’ячем у реальному часі. Звісно, все це може робити людина, але це штучний інтелект, здатний розпізнавати й передбачати, що станеться далі, передає The Verge.
Але якщо натиснути на опис відео на YouTube, то Google містить важливе застереження:
Для цілей цієї демонстрації затримка була зменшена, а відповіді Gemini були скорочені для стислості.
Вакансії
Журналіст, автор історій про IT, бізнес та людей в MC.today MC.today
Senior/Lead Python Engineer Impressit, з/п 7000
Senior DevOps (Solutions Architect) Hygge Software
Java Developer Go Interactive, Віддалено
Саме це обурює Олсон. Згідно з її статтею, Google визнав, коли його попросили прокоментувати, що відеодемонстрація не відбувалася в реальному часі з голосовими підказками, а натомість використовувалися нерухомі кадри з необробленого матеріалу, а потім виписувалися текстові підказки, на які Gemini реагував.
Google не погоджується. На питання про правдивість демонстрації, компанія вказала на пост Оріола Віньялса, віцепрезидента з досліджень і керівника напрямку глибокого навчання в Google DeepMind (також співкерівника Gemini), в якому пояснюється, як команда створила відеоролик.
Усі підказки та результати роботи користувача у відео є справжніми, скороченими для стислості. Відео ілюструє, як може виглядати багаторежимний користувацький досвід, створений за допомогою Gemini. Ми створили його, щоб надихнути розробників.
Він додав, що команда надала Gemini зображення та тексти й попросила його відповісти, передбачивши, що буде далі.
Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0
We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP
— Oriol Vinyals (@OriolVinyalsML) December 7, 2023