Нова китайська модель ШІ DeepSeek загрожує домінуванню США

26 января, 10:01, 2025

Маловідома лабораторія штучного інтелекту з Китаю викликала паніку в Кремнієвій долині після випуску моделей штучного інтелекту, які можуть перевершити найкращі в Америці, попри те, що побудовані дешевше та з менш потужними чіпами.

Наприкінці грудня DeepSeek, як називається лабораторія, представила безкоштовну широкомовну модель із відкритим вихідним кодом, для створення якої знадобилося лише два місяці та менш як 6 мільйонів доларів із використанням чіпів зі зниженими можливостями від Nvidia під назвою H800s.

Нові розробки викликали занепокоєння щодо того, чи скорочується лідерство Америки в області штучного інтелекту, і поставили під сумнів величезні витрати великих технологій на створення моделей ШІ та центрів обробки даних.

У серії тестів третьої сторони модель DeepSeek перевершила MetaLlama 3.1 від OpenAI, GPT-4o від OpenAI і Claude Sonnet 3.5 від Anthropic у діапазоні точності від розв'язання складних задач до математики та кодування.

DeepSeek у понеділок випустив r1, модель міркування, яка також перевершила останню o1 OpenAI у багатьох із цих сторонніх тестів.

«Побачити нову модель DeepSeek надзвичайно вражаюче з погляду того, як вони справді ефективно створили модель з відкритим кодом, яка виконує ці обчислення часу висновку, і є надзвичайно ефективною для обчислень», — сказав генеральний директор Microsoft Сатья Наделла на World World. Економічний форум у Давосі, Швейцарія, у середу. «Ми повинні дуже, дуже серйозно поставитися до розвитку подій у Китаї».

DeepSeek також довелося керуватися суворими обмеженнями щодо напівпровідників , які уряд США наклав на Китай, відрізаючи країну від доступу до найпотужніших чіпів, таких як H100 від Nvidia. Останні досягнення свідчать про те, що DeepSeek або знайшов спосіб обійти правила, або що експортний контроль не був тим обмеженням, яке планував Вашингтон.

«Вони можуть взяти справді хорошу велику модель і використати процес, який називається дистиляцією», — сказав генеральний партнер Benchmark Четан Путтагунта. «По суті, ви використовуєте дуже велику модель, щоб допомогти вашій маленькій моделі зрозуміти те, що ви хочете. Це насправді дуже рентабельно».

Про лабораторію та її засновника Ляна Веньфена відомо небагато. Згідно з повідомленнями ЗМІ , DeepSeek був заснований китайським хедж-фондом під назвою High-Flyer Quant, який управляє активами близько 8 мільярдів доларів .

Але DeepSeek не єдина китайська компанія, яка пробивається.

Провідний дослідник штучного інтелекту Кай-Фу Лі заявив, що для навчання його стартапу 01.ai було використано лише 3 мільйони доларів. Материнська компанія TikTok ByteDance у середу випустила оновлення своєї моделі, яке, як стверджується, перевершує o1 OpenAI у ключовому тесті бенчмарку.

«Необхідність — це мати винаходу», — сказав генеральний директор Perplexity Аравінд Шрінівас. «Оскільки їм довелося знайти обхідні шляхи, вони насправді створили щось набагато ефективніше».

Источник материала

InternetUA

Поделиться сюжетом

Технологии

Наука Космос Гаджеты Игры Интернет Другие

Среди девяток спрятанное число 6: попытайтесь разгадать головоломку за 3 секунды

Gazeta UA

21 июля 2026

ЕС собирается штрафовать за сокрытие использования искусственного интеллекта: подробности жесткого закона

Новости Украины

14 часов назад

В Армении обнаружили гробницу бронзового века: внутри нашли нечеловеческие останки

Фокус

21 июля 2026

Станет ли человек новым классом активов - американский стартап с украинской командой предлагает собственный ответ

Comments UA

3 дня назад

От веера до электрического пропеллера: удивительная история изобретения вентилятора

Comments UA

22 секунды назад

Фото, изменившее человечество навсегда: снимок из космоса перевернул представление о Земле

TSN

12 минут назад

GTA 6 устанавливает новый шокирующий рекорд: игрокам нужно спешить с активацией игры

Comments UA

28 июля 2026

В Антарктиде действует бомба замедленного действия: высвобождает ртуть, копившуюся сотни лет

Фокус

28 июля 2026

Почему кошки могут часами смотреть в окно: у них есть на это веская причина

TSN

28 июля 2026