Нова китайська модель ШІ DeepSeek загрожує домінуванню США
Нова китайська модель ШІ DeepSeek загрожує домінуванню США

Нова китайська модель ШІ DeepSeek загрожує домінуванню США

Маловідома лабораторія штучного інтелекту з Китаю викликала паніку в Кремнієвій долині після випуску моделей штучного інтелекту, які можуть перевершити найкращі в Америці, попри те, що побудовані дешевше та з менш потужними чіпами. 

Наприкінці грудня DeepSeek, як називається лабораторія, представила безкоштовну широкомовну модель із відкритим вихідним кодом,  для створення якої  знадобилося лише два місяці та менш як 6 мільйонів доларів із використанням чіпів зі зниженими можливостями від Nvidia під назвою H800s. 

Нові розробки викликали занепокоєння щодо того, чи скорочується лідерство Америки в області штучного інтелекту, і поставили під сумнів величезні витрати великих технологій на створення моделей ШІ та центрів обробки даних. 

У серії тестів третьої сторони модель DeepSeek перевершила MetaLlama 3.1 від OpenAI, GPT-4o від OpenAI і Claude Sonnet 3.5 від Anthropic у діапазоні точності від розв'язання складних задач до математики та кодування. 

DeepSeek у понеділок випустив r1, модель міркування, яка також  перевершила  останню o1 OpenAI у багатьох із цих сторонніх тестів.

«Побачити нову модель DeepSeek надзвичайно вражаюче з погляду того, як вони справді ефективно створили модель з відкритим кодом, яка виконує ці обчислення часу висновку, і є надзвичайно ефективною для обчислень», — сказав генеральний директор Microsoft Сатья Наделла на World World. Економічний форум у Давосі, Швейцарія, у середу. «Ми повинні дуже, дуже серйозно поставитися до розвитку подій у Китаї». 

DeepSeek також довелося керуватися суворими  обмеженнями щодо напівпровідників  , які уряд США наклав на Китай, відрізаючи країну від доступу до найпотужніших чіпів, таких як H100 від Nvidia. Останні досягнення свідчать про те, що DeepSeek або знайшов спосіб обійти правила, або що експортний контроль не був тим обмеженням, яке планував Вашингтон.

«Вони можуть взяти справді хорошу велику модель і використати процес, який називається дистиляцією», — сказав генеральний партнер Benchmark Четан Путтагунта. «По суті, ви використовуєте дуже велику модель, щоб допомогти вашій маленькій моделі зрозуміти те, що ви хочете. Це насправді дуже рентабельно».

Про лабораторію та її засновника Ляна Веньфена відомо небагато. Згідно з повідомленнями ЗМІ  , DeepSeek був заснований китайським хедж-фондом під назвою High-Flyer Quant, який управляє активами близько 8 мільярдів доларів  .

Але DeepSeek не єдина китайська компанія, яка пробивається. 

Провідний дослідник штучного інтелекту Кай-Фу Лі  заявив, що  для навчання його стартапу 01.ai було використано лише 3 мільйони доларів. Материнська компанія TikTok ByteDance у середу  випустила  оновлення своєї моделі, яке, як стверджується, перевершує o1 OpenAI у ключовому тесті бенчмарку. 

«Необхідність — це мати винаходу», — сказав генеральний директор Perplexity Аравінд Шрінівас. «Оскільки їм довелося знайти обхідні шляхи, вони насправді створили щось набагато ефективніше».

Источник материала
loader
loader