OpenAI представила дві нові відкриті мовні моделі для локального використання

6 серпня, 13:46

OpenAI оголосила про запуск двох мовних моделей з відкритими вагами, які відзначаються високим рівнем логічного мислення та адаптовані для роботи на звичайних ноутбуках. Вони демонструють продуктивність, співставну з компактними закритими моделями компанії.

Про це повідомило Reuters.

На відміну від повністю відкритих моделей, моделі з відкритими вагами надають лише доступ до параметрів, але дозволяють локальний запуск і гнучке налаштування. Як наголосив співзасновник OpenAI Ґреґ Брокман, це важлива перевага - моделі можна запускати на власному обладнанні без підключення до хмари.

Вперше ці моделі стали доступними на платформі Amazon Bedrock, що свідчить про розширення співпраці між OpenAI і AWS. Деталі домовленостей не розголошуються. На тлі сповільнення зростання AWS і зростання конкуренції на ринку відкритих моделей, це рішення є стратегічним.

До цього часу лідерство утримували моделі Llama від Meta, однак ситуація змінилася після виходу китайської DeepSeek, яка запропонувала більш ефективну й доступну альтернативу. Тим часом Meta затримала реліз Llama 4.

Нові моделі - перші відкриті з 2019 року (з часів GPT-2). Старша, gpt-oss-120b, працює на одному GPU, а gpt-oss-20b - підходить навіть для персонального комп’ютера. Вони добре справляються із завданнями з програмування, математики та медицини. Моделі тренувалися на текстовому датасеті зі спеціальним фокусом на науку, математику та кодування.

OpenAI, яку підтримує Microsoft і яка оцінюється в $300 млрд, наразі веде раунд залучення до $40 млрд інвестицій за участі SoftBank.

Джерело матеріала