Деякі китайські моделі ШІ вже перемагають своїх конкурентів у США

19 декабря, 09:45

Спроби Китаю домінувати у світі штучного інтелекту можуть принести свої плоди, оскільки інсайдери галузі та технологічні аналітики повідомили CNBC, що китайські моделі штучного інтелекту вже надзвичайно популярні та не відстають від американських і навіть перевершують їх за продуктивністю.

ШІ став останнім полем битви між США та Китаєм, причому обидві сторони вважають його стратегічною технологією. Вашингтон продовжує обмежувати доступ Китаю до передових чіпів, призначених для підтримки штучного інтелекту, через побоювання, що ця технологія може загрожувати національній безпеці США.

Це змусило Китай застосувати власний підхід до підвищення привабливості та продуктивності своїх моделей штучного інтелекту, зокрема покладаючись на технології відкритого коду та розробляючи власне надшвидке програмне забезпечення та мікросхеми.

Китай створює популярні магістратури

Як і деякі провідні американські фірми в космосі, китайські фірми штучного інтелекту розробляють так звані великі мовні моделі, або LLM, які навчаються на величезних обсягах даних і підтримують програми, такі як чат-боти.

Проте, на відміну від моделей OpenAI, на яких працює надзвичайно популярний ChatGPT, багато з цих китайських компаній розробляють LLM з відкритим вихідним кодом, які розробники можуть безплатно завантажувати та створювати на них без суворих ліцензійних вимог з боку винахідника.

На Hugging Face, репозиторії LLM, китайські LLM є найбільш завантажуваними, за словами Тіжен Ван, інженера з машинного навчання в компанії. Qwen, сімейство моделей ШІ, створене китайським гігантом електронної комерції Alibaba, є найпопулярнішим на Hugging Face, сказав він.

«Qwen швидко набирає популярності завдяки своїй видатній продуктивності на конкурентних тестах», — сказав Ван CNBC електронною поштою.

Він додав, що Qwen має «дуже сприятливу модель ліцензування», що означає, що вона може використовуватися компаніями без необхідності «розширеної юридичної перевірки».

Qwen постачатися в різних розмірах або параметрах, як вони відомі у світі LLM. Моделі з великими параметрами потужніші, але мають вищі обчислювальні витрати, тоді як менші моделі дешевші в експлуатації.

«Незалежно від розміру, який ви виберете, Qwen, швидше за все, буде однією з найефективніших моделей, доступних на цей час», — додав Ван.

DeepSeek, стартап, також нещодавно зробив хвилю з моделлю під назвою DeepSeek-R1. Минулого місяця DeepSeek заявив, що його модель R1 конкурує з OpenAI o1 — моделлю, призначеною для міркувань або вирішення складніших завдань.

Ці компанії стверджують, що їхні моделі можуть конкурувати з іншими пропозиціями з відкритим кодом, такими як Meta’s Llama, а також закриті LLM, такі як OpenAI, у різних функціях.

«Останній рік ми спостерігали зростання китайського внеску з відкритим кодом у штучний інтелект із дійсно високою продуктивністю, низькою вартістю обслуговування та високою пропускною спроможністю», — сказала CNBC електронною поштою Грейс Ісфорд, партнер Lux Capital.

Китай підштовхує відкритий вихідний код до глобального розвитку

Технологія з відкритим кодом слугує багатьом цілям, зокрема стимулюванню інновацій, оскільки більше розробників мають доступ до неї, а також створенню спільноти навколо продукту.

Не лише китайські фірми запустили LLM з відкритим кодом. Батьківська компанія Facebook, Meta, а також європейський стартап Mistral також мають версії моделей ШІ з відкритим кодом.

Але враховуючи, що технологічна галузь опинилася в центрі геополітичної битви між Вашингтоном і Пекіном, LLM з відкритим кодом дають китайським фірмам ще одну перевагу: це дозволяє використовувати їхні моделі в усьому світі.

«Китайські компанії хотіли б, щоб їхні моделі використовувалися за межами Китаю, тож це безперечно спосіб для компаній стати глобальними гравцями у сфері штучного інтелекту», — сказав CNBC електронною поштою Пол Тріоло, партнер глобальної консалтингової фірми DGA Group.

Хоча наразі увага зосереджена на моделях штучного інтелекту, також точаться дебати щодо того, які програми будуть побудовані на їх основі — і хто буде домінувати в глобальному інтернет-ландшафті в майбутньому.

«Якщо ви припустите, що ці передові базові моделі штучного інтелекту є настільними ставками, це стосується того, для чого ці моделі використовуються, наприклад, для прискорення передових наукових та інженерних технологій», — сказав Ісфорд з Lux Capital.

Сучасні моделі ШІ порівнюють з операційними системами, такими як MicrosoftWindows, GoogleAndroid і AppleiOS з потенціалом домінувати на ринку, як це роблять ці компанії на мобільних пристроях і ПК.

Якщо це правда, це підвищує ставки для створення панівного LLM.

«Вони [китайські компанії] сприймають магістратуру як центр майбутніх технологічних екосистем», — сказав CNBC електронною поштою Сінь Сун, старший викладач китайського та східноазіатського бізнесу в Королівському коледжі Лондона.

«Їхні майбутні бізнес-моделі залежатимуть від того, що розробники приєднаються до їхніх екосистем, розроблятимуть нові програми на основі LLM і залучатимуть користувачів і дані, з яких можна згодом отримувати прибуток за допомогою різних засобів, включаючи, але далеко за межі, спрямування користувачів на використання їхніх хмарних сервісів», Сонце додав.

Обмеження чипів ставлять під сумнів майбутнє ШІ Китаю

Моделі штучного інтелекту навчаються на величезних обсягах даних, що потребує величезної обчислювальної потужності. Наразі Nvidiaє провідним розробником мікросхем, необхідних для цього, відомих як графічні процесори (GPU).

Більшість провідних компаній зі штучного інтелекту навчають свої системи на найбільш високопродуктивних чіпах Nvidia, але не в Китаї.

Приблизно за останній рік США посилили обмеження на експорт сучасного напівпровідникового обладнання та обладнання для виробництва мікросхем до Китаю. Мається на увазі NvidiaПередові чіпи не можна експортувати в країну, і компанії довелося створювати напівпровідники, сумісні з санкціями, для експорту.

Попри ці обмеження, китайським компаніям все ж вдалося випустити передові моделі штучного інтелекту.

«Наразі основні китайські технологічні платформи мають достатній доступ до обчислювальної потужності, щоб продовжувати вдосконалювати моделі. Це тому, що вони накопичили велику кількість графічних процесорів Nvidia, а також використовують вітчизняні графічні процесори від Huawei та інших фірм», — сказав Тріоло з DGA Group.

Дійсно, китайські компанії активізують зусилля зі створення життєздатних альтернатив Nvidia . Huawei була одним із провідних гравців у досягненні цієї мети в Китаї, а такі фірми, як Baiduі Alibaba також інвестували в дизайн напівпровідників.

«Однак розрив у розширеному апаратному обчисленні з часом збільшиться, особливо наступного року, коли Nvidia розгортає свої системи на базі Blackwell, експорт яких обмежено в Китай», — сказав Тріоло.

Isford з Lux Capital зазначив, що Китай «систематично інвестує та розвиває всю свою вітчизняну інфраструктуру ШІ за межами Nvidia за допомогою високопродуктивних чіпів ШІ від таких компаній, як Baidu».

«Незалежно від того, заборонені чіпи Nvidia в Китаї чи ні, це не завадить Китаю інвестувати та будувати власну інфраструктуру для створення та навчання моделей ШІ», — додала вона.

Источник материала

InternetUA

Поделиться сюжетом

Технологии

Наука Космос Гаджеты Игры Интернет Другие

На Юпитере появились бури больше Земли: из-за них может исчезнуть особенность планеты

Фокус

11 декабря 2024

"Зеленая" энергия может быть доступна 24/7: что известно о новых методах хранения

Фокус

3 минуты назад

Инсайдер: Skull & Bones от Ubisoft ждёт второй год поддержки

GameMag

6 минут назад

Пилот самолета объяснил, что произойдет, если пассажиры не включат режим полета на смартфоне

TSN

9 декабря 2024

Смартфон прослужит десятки лет: что для этого нужно сделать, пояснили эксперты

Фокус

9 минут назад

Пользователи сообщают о масштабном сбое в Резерв+

Корреспондент

9 минут назад

Деякі китайські моделі ШІ вже перемагають своїх конкурентів у США

Китай створює популярні магістратури

Китай підштовхує відкритий вихідний код до глобального розвитку

Обмеження чипів ставлять під сумнів майбутнє ШІ Китаю

Технологии

Лазерный станок: универсальный инструмент для современного производства

На 50% эффективнее обычных: новый датчик улучшит работу ветряных турбин

В Facebook, Instagram и WhatsApp произошел масштабный сбой

На Юпитере появились бури больше Земли: из-за них может исчезнуть особенность планеты

"Зеленая" энергия может быть доступна 24/7: что известно о новых методах хранения

Инсайдер: Skull & Bones от Ubisoft ждёт второй год поддержки

Пилот самолета объяснил, что произойдет, если пассажиры не включат режим полета на смартфоне

Смартфон прослужит десятки лет: что для этого нужно сделать, пояснили эксперты

Пользователи сообщают о масштабном сбое в Резерв+

Технологии

Лазерный станок: универсальный инструмент для современного производства

На 50% эффективнее обычных: новый датчик улучшит работу ветряных турбин

В Facebook, Instagram и WhatsApp произошел масштабный сбой

На Юпитере появились бури больше Земли: из-за них может исчезнуть особенность планеты

"Зеленая" энергия может быть доступна 24/7: что известно о новых методах хранения

Инсайдер: Skull & Bones от Ubisoft ждёт второй год поддержки

Пилот самолета объяснил, что произойдет, если пассажиры не включат режим полета на смартфоне

Смартфон прослужит десятки лет: что для этого нужно сделать, пояснили эксперты

Пользователи сообщают о масштабном сбое в Резерв+