Claude Opus 4.8 уже тут: ШІ-модель стала чеснішою, краще пише код і не тільки
Claude Opus 4.8 уже тут: ШІ-модель стала чеснішою, краще пише код і не тільки

Claude Opus 4.8 уже тут: ШІ-модель стала чеснішою, краще пише код і не тільки

Компанія Anthropic передову показала мовну Claude Opus 4.8 з поліпшеними навичками програмування, фінансової аналітики та роботи з агентами.

Нейромережа стала працювати в 2,5 раза швидше і навчилася чесно визнавати свої помилки, пише портал MacRumors.

Результати тестів

Тестувальники відзначають, що версія Opus 4.8 стала надійнішою при виконанні складних багатоступеневих завдань. Модель у чотири рази рідше пропускає помилки в написаному коді порівняно з версією 4.7. ШІ тепер частіше попереджає користувача про свою невпевненість і уникає необґрунтованих тверджень, демонструючи низький рівень генерації неправдивої інформації.

У тестах написання коду SWE-Bench Pro нейромережа набрала 69,2%, обійшовши конкурентів GPT-5.5 і Gemini 3.1 Pro. При цьому рішення від OpenAI поки що зберігає лідерство в специфічних бенчмарках термінального кодингу.

Бенчмарки Claude Opus 4.8
Фото: Anthropic

Швидкість роботи та нові інструменти

Розробники значно оптимізували платформу. Швидкий режим (fast mode) тепер генерує відповіді в 2,5 раза швидше і обходиться розробникам за API втричі дешевше за минулі версії. Для звичайних користувачів вартість базових тарифів залишилася без змін.

Разом із релізом моделі Anthropic додала кілька нових функцій:

  • Dynamic workflows. Інструмент дає змогу ШІ планувати роботу і керувати сотнями паралельних субагентів. Нейромережа здатна проводити масштабні міграції баз даних, переписуючи сотні тисяч рядків коду за одну сесію. Функція доступна в корпоративних тарифах Enterprise, Team і Max.
  • Effort control. Користувачі сервісу Claude.ai можуть вручну регулювати "зусилля" нейромережі. Зниження параметра прискорює видачу відповіді та економить ліміти запитів. За замовчуванням встановлено високий рівень зусиль для максимальної якості результату.
  • Messages API. Розробники отримали можливість змінювати системні інструкції для ШІ прямо під час виконання завдання, додаючи нові ввідні в масив повідомлень.

Найближчими тижнями компанія планує випустити революційну модель класу Mythos. Зараз цей надрозумний ШІ проходить закрите тестування в декількох організаціях для точного налаштування систем безпеки.

Раніше повідомлялося, що OpenAI допоможе вивчити вплив ШІ на українську освіту.

Також Фокус писав про перші враження від Xiaomi 17T Pro.

Джерело матеріала
loader
loader