Гра розумів: як США та Китай змагаються за першість у розвитку штучного інтелекту
DeepSeek — це китайська стартап-компанія, яка нещодавно випустила нову модель штучного інтелекту — DeepSeek-R1. Розробка відповідає за можливостями моделям штучного інтелекту від американських компаній OpenAI, Meta і Google. Але при цьому модель використовує лише дві тисячі комп’ютерних чипів старшого покоління Nvidia — до прикладу, система ШІ Meta використовує близько 16 тисяч чипів. А потужності для навчання системи коштують менш як шість мільйонів доларів. Це суттєво менші гроші, ніж «більш ніж 100 млн доларів», про які говорив керівник OpenAI Сем Альтман при обговоренні навчання GPT-4.
27 січня DeepSeek обійшов ChatGPT і став найпопулярнішим безплатним застосунком в App Store. Також додаток зібрав понад один мільйон завантажень у Google Play. На обох платформах застосунок використовує основну версію чатбота DeepSeek-V3, яка є безплатною, однак потребує авторизації. Модель DeepSeek-R1 наразі доступна для вебверсій.
Увечері того-таки 27 січня новостворений китайський чат-бот зазнав масштабної кібератаки, через яку тимчасово призупинив реєстрацію нових користувачів. Станом на 31 січня проблему виправили.
Як виник DeepSeek
Підприємець Лян Веньфен заснував компанію DeepSeek у 2023 році у місті Ханчжоу. 40-річний Веньфен — випускник факультету інформаційної та електронної інженерії державного Чжецзянського університету. З 2016 року він є гендиректором хедж-фонду High Flyer, що використовує штучний інтелект для торгів на фінансових ринках і є основним спонсором DeepSeek.
Маловідомий загалу Лян Веньфен нині опинився у центрі міжнародної уваги. Нещодавно він навіть був присутній на зустрічі, яку організував прем’єр-міністр Китаю Лі Цян. Це, як пише BBC, свідчить про дедалі більшу популярність DeepSeek в індустрії ШІ й увагу до нього з боку держави, яка декларує пріоритетом розвиток нових технологій.
«Часто ми говоримо, що між китайським і американським штучним інтелектом відстань — один чи два роки, але справжня різниця полягає між оригінальністю та наслідуванням. Якщо нічого не зміниться, Китай завжди буде послідовником», — казав Лян торік в інтерв’ю. І, здається, таки винайшов оригінальний шлях.
У чому прогресивність моделі DeepSeek-R1
Як заявляють розробники, продуктивність R1 дорівнює моделі під назвою «o1» від Open AI. Вона може розв’язувати математичні задачі, писати код, аналізувати дані та навіть жартувати. Її особливістю серед іншого є загальнодоступна опція «reasoning», яка пояснює, як система дійшла до конкретного висновку, коли відповідала на запит користувача.
Більшість моделей, які розробляють компанії Кремнієвої долини у галузі ШІ, залишаються закритими. Натомість китайська модель R1 має відкритий вихідний код, що дозволяє іншим компаніям чи дослідникам використати його для створення власних аналогічних продуктів.
Генеральний директор OpenAI Сем Альтман назвав модель R1 «потужною», тоді як виконавчий директор Meta Марк Цукерберг віддав компанії належне за «досягнення, які ми сподіваємося реалізувати в наших системах». Водночас Цукерберг підмітив, що прорив DeepSeek — далеко не єдиний у галузі ШІ, яка постійно розвивається.
Дональд Трамп же вважає, що китайський штучний інтелект DeepSeek має стати «тривожним дзвіночком для американських галузей», і що Штатам потрібно «зосередитися на конкуренції, щоб перемогти».
Обвал фондових ринків і що до цього призвело
Повідомлення про успіх DeepSeek сколихнуло позиції технологічних гігантів на світових фондових ринках. Одна з причин — низька вартість китайської моделі штучного інтелекту та її здатність працювати на старіших процесорах.
Через це на ринку виникли сумніви щодо обґрунтованості ціни таких компаній як Nvidia. Акції американського виробника графічних процесорів впали на 17 %. Лише за 27 січня Nvidia втратила майже 600 млрд доларів ринкової капіталізації, що є найбільшим падінням в історії фондового ринку США, пише CNBS.
Financial Times указує, що ринки сколихнулися, бо інвестори переоцінили ймовірні майбутні інвестиції в ШІ. Так, технологічний індекс біржі Nasdaq Composite упав на 3,1 відсотка, тоді як індекс S&P 500 упав на 1,5 відсотка, а Microsoft — на 2,1 відсотка.
Чи може DeepSeek бути крадіжкою
Керівники китайської компанії кажуть, що витратили на розробку свого проєкту близько шести мільйонів доларів, тоді як конкуренти DeepSeek зі США на подібні чат-боти витрачали сотні мільйонів і навіть мільярди. Така різниця у сумах витрат змусила американців сумніватися у доброчесності китайських винахідників.
Нещодавно в OpenAI звинуватили DeepSeek у використанні їхнього штучного інтелекту для власного навчання. За інформацією OpenAI, китайська компанія застосовувала метод «дистиляції» — процес, під час якого одна модель штучного інтелекту навчається на відповідях іншої моделі генеративного ШІ.
Протягом останніх двох років, за президентства Джо Байдена, Вашингтон запровадив численні експортні обмеження, щоб придушити прогрес Пекіна в розробці ШІ. Зараз, за інформацією джерел Bloomberg, чиновники Білого дому та ФБР розслідують, чи купував китайський стартап DeepSeek передові напівпровідники Nvidia через третіх осіб у Сінгапурі в обхід американських обмежень.
Як пише BBC, засновник DeepSeek Лян Веньфен мав у запасі 50 тисяч чипів Nvidia A100, експорт яких був заборонений до Китаю з вересня 2022 року. Саме завдяки поєднанню цих мікросхем із дешевшими, менш складними аналогами Веньфену вдалося створити таку потужну модель ШІ.
Зберігання даних і цензура у DeepSeek
Дані, які вводять користувачі додатка, і пов’язаний із ними вміст може використовуватися для навчання або вдосконалення моделей DeepSeek. Якщо користувач не вимагає видалити дані, то вони можуть довгостроково залишатися в системах. Такий підхід відрізняє DeepSeek від OpenAI, який детально регулює процедури відмови та видалення інформації. Про це пише Forbes.
Користувачі додатка також помітили, що чат-бот відмовляється відповідати на запитання про чутливі для Пекіна теми, зокрема про розстріл демонстрантів на площі Тяньаньмень чи недоліки Комуністичної партії Китаю. Застосунок запрограмований так, аби користувачі отримували лише ту інформацію, яка узгоджена з комуністичною ідеологією. Але дослідники припускають, що модель навчалася на великій кількості даних, тобто має інформацію про ці події, проте до моделі прикрутили цензурний шар, який не дозволяє видавати ці дані у відповідях.
Занепокоєння зростає
Міністерство оборони й Конгрес США днями заборонили своїм співробітникам користуватися новим китайським чат-ботом на основі штучного інтелекту DeepSeek. У Тайвані також додатком заборонили послуговуватися всім державним установам і підприємствам критичної інфраструктури. Пояснили це тим, що чат-бот нібито може передавати дані китайському уряду.
Італія стала першою країною в Європі, яка повністю заблокувала застосунок DeepSeek, аби захистити персональні дані своїх жителів. Франція ж наразі хоче перевірити, як працює система штучного інтелекту китайського стартапу та які є можливі ризики для конфіденційності користувачів.
DeepSeek — це лише початок
За останні шість місяців Китай затвердив понад 40 моделей штучного інтелекту. Такий підхід підкреслює наміри Пекіна як до розвитку технологій ШІ, так і до контролю над галуззю, пише Reuters.
Так, китайський техногігант Alibaba, що спеціалізується на електронній комерції, хмарних технологіях і фінансових послугах, недавно випустив нову версію свого ШІ — Qwen 2.5. У компанії говорять, що їхній штучний інтелект перевершує показники конкурента DeepSeek R1.
Модель Qwen 2.5 з’явилася у вихідний — перший день китайського Нового року, що свідчить про тиск популярності DeepSeek не лише на іноземних, а й на внутрішніх конкурентів, додає Reuters.
Інавгурація Трампа та його політика щодо ШІ
Рішення компанії DeepSeek представити нову модель штучного інтелекту перед інавгурацією президента США Дональда Трампа виявилося політичним за своєю суттю. Його метою було підірвати довіру громадськості до управління сферою ШІ у важливий момент політики США, йдеться у матеріалі «Голосу Америки».
Ставши президентом вдруге, Дональд Трамп одразу скасував указ свого попередника Джо Байдена, спрямований на зменшення ризиків, пов’язаних зі штучним інтелектом. А ще — анонсував 500 млрд доларів інвестицій у створення нової державної компанії Stargate, яка упродовж чотирьох років має розбудувати інфраструктуру штучного інтелекту.
Виступаючи в оточенні керівників Stargate, новообраний американський президент пообіцяв, що реалізація цього проєкту «майже миттєво» створить 100 тисяч робочих місць і збереже «технологічне майбутнє» у США. «Це монументальне починання є гучною заявою впевненості в потенціалі Америки», — цитує Трампа The Guardian.
Що тепер
Випуск нової моделі штучного інтелекту, відомої як R1, похитнув уявлення про перевагу США у сфері штучного інтелекту та підвищив імовірність того, що деякі китайські компанії навчаться перемагати Кремнієву долину в її власній грі. Про це пише Financial Times.
Останні розробки DeepSeek можуть не означати, що Китай уже випереджає США у розвитку штучного інтелекту, але вони точно змінюють динаміку змагання між цими двома країнами. Тепер лідерство у сфері штучного інтелекту належатиме не тому, хто матиме доступ до кращих чипів, а тому, хто їх краще використовуватиме.
Колаж: Микола Шиманський, «Детектор медіа» (використані зображення pixabay.com)
До 22-річчя з дня народження видання ми відновлюємо нашу Спільноту! Це коло активних людей, які хочуть та можуть фінансово підтримати наше видання, долучитися до генерування ідей та створення якісних матеріалів, просувати свідоме медіаспоживання і разом протистояти російській дезінформації.

