/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F52%2F8cdc7241c1b588dbc0baa8b850e34590.jpg)
Google представляє нову модель Gemini, заявляючи, що вона розумніша за GhatGPT та DeepSeek
Gemini 2.5 Pro Experimental вже доступна на платформі для розробників Google AI Studio, а також у додатку Gemini для передплатників тарифного плану Gemini Advanced вартістю 20 доларів на місяць. У майбутньому, як заявляє Google, всі нові моделі ШІ матимуть вбудовані можливості міркування, повідомляє 24 Канал з посиланням на блог Google.
Найкращий з найкращих
Відтоді, як у вересні 2024 року OpenAI запустила першу модель міркувань ШІ o1, технологічна індустрія змагалася, щоб зрівнятися або перевершити можливості цієї моделі у своїх розробках. Сьогодні Anthropic, DeepSeek, Google та xAI мають моделі міркувань, які використовують додаткову обчислювальну потужність і час для перевірки фактів і міркувань над проблемами перед тим, як надати відповідь.
Методи міркувань допомогли моделям ШІ досягти нових висот у вирішенні математичних і кодувальних завдань. Багато хто у світі технологій вважає, що моделі міркувань стануть ключовим компонентом ШІ-агентів – автономних систем, здатних виконувати завдання практично без втручання людини. Однак ці моделі також і дорожчі.
Google і раніше експериментував з моделями міркувань ШІ, випустивши в грудні "мислячу" версію Gemini. Але Gemini 2.5 – це найсерйозніша спроба компанії перевершити моделі OpenAI серії "o".
Розробники стверджують, що Gemini 2.5 Pro перевершує попередні передові моделі ШІ, а також деякі з провідних конкуруючих моделей ШІ за кількома показниками. Зокрема, компанія каже, що розробила Gemini 2.5 для створення візуально привабливих веб-додатків і додатків з агентним кодуванням.
Gemini 2.5 – це модель мислення, розроблена для вирішення дедалі складніших завдань. Наша перша модель 2.5, Gemini 2.5 Pro Experimental, випереджає загальноприйняті бенчмарки зі значним відривом і демонструє сильні міркування та можливості коду,
– йдеться в заяві компанії.
- У тесті Aider Polyglot, який вимірює можливості редагування коду, Gemini 2.5 Pro набрав 68,6%, випередивши найкращі моделі штучного інтелекту від OpenAI, Anthropic та китайської лабораторії DeepSeek.
- В іншому тесті, що вимірює здібності розробників програмного забезпечення, SWE-bench Verified, Gemini 2.5 Pro набрав 63,8%, випередивши o3-mini від OpenAI і R1 від DeepSeek, але відстає від Claude 3.7 Sonnet компанії Anthropic, який набрав 70,3%.
- На так званому "останньому іспиті людства", мультимодальному тесті, що складається з тисяч різних питань з математики, гуманітарних та природничих наук, Gemini 2.5 Pro набрав 18,8%, що є кращим результатом, ніж у більшості конкуруючих флагманських моделей.
Результати тестів / Фото Google
Gemini 2.5 Pro Experimental також лідирує в математичних тестах і тестах генерації коду AIME 2025 і LiveCodeBench v5. Компанія стверджує, що 2.5 являє собою "великий стрибок" в продуктивності кодування в порівнянні з попередньою версією.
Порівняння різних моделей від різних розробників / Фото Google
Модель Google сприймає запити за допомогою тексту, аудіо, відео та зображень, але видає результат лише текстом. Її знання обриваються в січні 2025 року.
Google заявляє, що Gemini 2.5 Pro постачається з контекстним вікном на 1 мільйон токенів, що означає, що ШІ-модель може сприймати приблизно 750 000 слів за один прохід. Це більше, ніж вся серія книг "Володар перснів". Незабаром Gemini 2.5 Pro буде підтримувати вдвічі більшу довжину вхідних даних – 2 мільйони токенів.
Google не опублікував ціни на API для Gemini 2.5 Pro. Компанія каже, що надасть більше інформації в найближчі тижні.

