Claude Opus 4.8 уже здесь: ИИ-модель стала честнее, лучше пишет код и не только
Claude Opus 4.8 уже здесь: ИИ-модель стала честнее, лучше пишет код и не только

Claude Opus 4.8 уже здесь: ИИ-модель стала честнее, лучше пишет код и не только

Компания Anthropic передовую показала языковую Claude Opus 4.8 с улучшенными навыками программирования, финансовой аналитики и работы с агентами.

Нейросеть стала работать в 2,5 раза быстрее и научилась честно признавать свои ошибки, пишет портал MacRumors.

Результаты тестов

Тестировщики отмечают, что версия Opus 4.8 стала надежнее при выполнении сложных многоступенчатых задач. Модель в четыре раза реже пропускает ошибки в написанном коде по сравнению с версией 4.7. ИИ теперь чаще предупреждает пользователя о своей неуверенности и избегает необоснованных утверждений, демонстрируя низкий уровень генерации ложной информации.

В тестах написания кода SWE-Bench Pro нейросеть набрала 69,2%, обойдя конкурентов GPT-5.5 и Gemini 3.1 Pro. При этом решение от OpenAI пока сохраняет лидерство в специфических бенчмарках терминального кодинга.

Бенчмарки Claude Opus 4.8
Фото: Anthropic

Скорость работы и новые инструменты

Разработчики значительно оптимизировали платформу. Быстрый режим (fast mode) теперь генерирует ответы в 2,5 раза быстрее и обходится разработчикам по API в три раза дешевле прошлых версий. Для обычных пользователей стоимость базовых тарифов осталась без изменений.

Вместе с релизом модели Anthropic добавила несколько новых функций:

  • Dynamic workflows. Инструмент позволяет ИИ планировать работу и управлять сотнями параллельных субагентов. Нейросеть способна проводить масштабные миграции баз данных, переписывая сотни тысяч строк кода за одну сессию. Функция доступна в корпоративных тарифах Enterprise, Team и Max.
  • Effort control. Пользователи сервиса Claude.ai могут вручную регулировать "усилия" нейросети. Снижение параметра ускоряет выдачу ответа и экономит лимиты запросов. По умолчанию установлен высокий уровень усилий для максимального качества результата.
  • Messages API. Разработчики получили возможность менять системные инструкции для ИИ прямо в процессе выполнения задачи, добавляя новые вводные в массив сообщений.

В ближайшие недели компания планирует выпустить революционную модель класса Mythos. Сейчас этот сверхумный ИИ проходит закрытое тестирование в нескольких организациях для точной настройки систем безопасности.

Также Фокус писал про первые впечатления от Xiaomi 17T Pro.

Источник материала
loader
loader