Google створив найрозумніший ШІ? Нова Gemini 2.5 перевершила всіх конкурентів у тестах — і доступна безплатно
/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2F7ca33b9accfc83e33bc04bbc746a49e5.png)
Google представила Gemini 2.5 — нове сімейство моделей штучного інтелекту, здатних до міркування.
З вересня 2024 року, коли OpenAI запустив першу ШІ-модель міркування, індустрія технологій поспішала зрівняти чи перевершити її можливості власними розробками — подібні є в Anthropic, DeepSeek, Google та xAI, і відрізняються від стандартних тим, що використовують додаткову обчислювальну потужність і час для перевірки фактів, а також запускають процес міркування, перш ніж дати відповідь.
Gemini 2.5 Pro набрала 68,6% в тесті Aider Polyglot та 63,8% у SWE-bench Verified (обидва перевіряють можливості програмування та редагування коду), перевершивши альтернативи від OpenAI та DeepSeek, але дещо відставши від Anthropic в другому. На «останньому іспиті людства», мультимодальному тесті, що складається з тисяч запитань, пов’язаних з математикою, гуманітарними та природничими науками, Gemini 2.5 Pro набрала 18,8% — так само краще, ніж більшість флагманських моделей конкурентів.
У демонстраційному відео можна подивитись, як 2.5 Pro використовує можливості міркування для програмування відеоігри на основі однієї підказки:
Gemini 2.5 Pro постачається з контекстним вікном у 1 мільйон токенів — тобто може приймати приблизно 750 000 слів за один раз (більше, ніж уся серія книг «Володар перснів»), однак незабаром і його планують подвоїти.
Мультимодальна модель Gemini 2.5 Pro Experimental вже доступна безплатно в Google AI Studio, а також в застосунку Gemini для передплатників тарифу Advanced за $20/місяць.
/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2F7ca33b9accfc83e33bc04bbc746a49e5.png)

