OpenAI запускає новий додаток під macOS для агентного кодування
OpenAI запускає новий додаток під macOS для агентного кодування

OpenAI запускає новий додаток під macOS для агентного кодування

Штучний інтелект вже має сейсмічний вплив на те, як пишеться програмне забезпечення, оскільки значна частина важкої роботи з програмування тепер виконується безліччю агентів та субагентів. Але оскільки розробники експериментують з новими інтерфейсами та форм-факторами для співпраці людини та штучного інтелекту, навіть найсучаснішим лабораторіям штучного інтелекту стає важко встигати за цим. 

Поточна тенденція полягає в агентній розробці програмного забезпечення — системах, де агенти штучного інтелекту можуть самостійно працювати над завданнями кодування — втіленням якої є додатки Claude Code та Cowork. Тим часом OpenAI поступово розробляє свій інструмент Codex, який був запущений як інструмент командного рядка минулого квітня та розширений до веб-інтерфейсу через місяць.

Зараз OpenAI робить важливий крок до того, щоб наздогнати. У понеділок компанія запустила новий додаток Codex для macOS, інтегруючи багато агентських практик, що стали популярними за останній рік. Новий додаток розроблений для паралельної роботи з кількома агентами, інтегруючи навички агентів та інші найсучасніші робочі процеси. Запуск також відбувся менш ніж через два місяці після запуску GPT-5.2-Codex , найпотужнішої моделі кодування OpenAI, якої, як сподівається компанія, буде достатньо, щоб спокусити користувачів Claude Code.

«Якщо ви дійсно хочете виконувати складну роботу над чимось комплексним, 5.2 – це найсильніша модель на сьогоднішній день», – сказав генеральний директор Сем Альтман журналістам під час прес-конференції. «Однак, нею було складніше користуватися, тому, на нашу думку, використання такого рівня можливостей моделі та її розміщення в більш гнучкому інтерфейсі матиме велике значення».

Хоча впевненість Альтмана в GPT-5.2 зрозуміла, бенчмарки кодування розповідають складнішу історію. GPT-5.2 справді посідає перше місце в TerminalBench (тесті, що вимірює, наскільки добре ШІ справляється із завданнями програмування командного рядка), принаймні на момент публікації. Але агенти з Gemini 3 та Claude Opus отримали приблизно еквівалентні результати — нижчі, але в межах похибки бенчмарка. Результати SWE -bench , ще одного бенчмарку кодування, який перевіряє здатність ШІ виправляти реальні помилки програмного забезпечення, схожі та не показують явної переваги GPT-5.2. Однак, агентські випадки використання було важко ефективно порівняти, а сучасні моделі можуть суттєво відрізнятися за користувацьким досвідом.

Додаток Codex також має низку нових функцій, які, за словами OpenAI, допоможуть йому досягти паритету або, в деяких випадках, випередити різні додатки Claude. Додаток Codex дозволить налаштувати автоматизацію, яку можна буде налаштувати на фоновий режим за автоматичним розкладом, а результати будуть поміщені в чергу для перегляду після повернення користувача. Користувачі також можуть вибрати різні особистості для агента — від прагматичного до емпатичного — залежно від їхнього стилю роботи.

Але для компанії найбільшою перевагою є величезна швидкість розробки, яка стала можливою завдяки штучному інтелекту. «Ви можете використати це з чистого аркуша паперу, абсолютно нового, щоб створити справді досить складне програмне забезпечення за кілька годин», – сказав Альтман. «Настільки швидко, наскільки я можу набирати нові ідеї, це межа того, що можна створити».

Источник материала
loader
loader