OpenAI представила дві нові відкриті мовні моделі для локального використання
OpenAI представила дві нові відкриті мовні моделі для локального використання

OpenAI представила дві нові відкриті мовні моделі для локального використання

OpenAI оголосила про запуск двох мовних моделей з відкритими вагами, які відзначаються високим рівнем логічного мислення та адаптовані для роботи на звичайних ноутбуках. Вони демонструють продуктивність, співставну з компактними закритими моделями компанії.

Про це повідомило Reuters.

На відміну від повністю відкритих моделей, моделі з відкритими вагами надають лише доступ до параметрів, але дозволяють локальний запуск і гнучке налаштування. Як наголосив співзасновник OpenAI Ґреґ Брокман, це важлива перевага - моделі можна запускати на власному обладнанні без підключення до хмари.

Вперше ці моделі стали доступними на платформі Amazon Bedrock, що свідчить про розширення співпраці між OpenAI і AWS. Деталі домовленостей не розголошуються. На тлі сповільнення зростання AWS і зростання конкуренції на ринку відкритих моделей, це рішення є стратегічним.

До цього часу лідерство утримували моделі Llama від Meta, однак ситуація змінилася після виходу китайської DeepSeek, яка запропонувала більш ефективну й доступну альтернативу. Тим часом Meta затримала реліз Llama 4.

Нові моделі - перші відкриті з 2019 року (з часів GPT-2). Старша, gpt-oss-120b, працює на одному GPU, а gpt-oss-20b - підходить навіть для персонального комп’ютера. Вони добре справляються із завданнями з програмування, математики та медицини. Моделі тренувалися на текстовому датасеті зі спеціальним фокусом на науку, математику та кодування.

OpenAI, яку підтримує Microsoft і яка оцінюється в $300 млрд, наразі веде раунд залучення до $40 млрд інвестицій за участі SoftBank.

Джерело матеріала
loader
loader