Усе, що потрібно знати про чат-бот DeepSeek: походження, технології, вплив на фондові ринки, проблеми з безпекою та порівняння з ChatGPT.
Китайський стартап DeepSeek буквально увірвався в ШІ-простір, засмутивши компанії з Кремнієвої долини і оскарживши припущення про те, чого насправді може досягти ШІ. Проєкт поєднує фінансування на рівні хедж-фондів, амбіції відкритого вихідного коду і глибоко вкорінену місію перевершити людський інтелект. При цьому він намагається затьмарити таких розробників, як OpenAI і Meta, склавши їм конкуренцію. То хто і що стоїть за новим чат-ботом? Відповіді шукав Фокус.
Хто розробив DeepSeek
Компанія DeepSeek була заснована в липні 2023 року випускником Чжецзянського університету на ім'я Лян Веньфен. Штаб-квартира розташовується в Ханчжоу і фінансується хедж-фондом High-Flyer, співзасновником якого є Лян. Варто зазначити, що активи цього фонду становлять близько 8 млрд доларів США.
DeepSeek працює на базі процесорів Nvidia A100, незважаючи на те, що їх експорт до Китаю заборонено. Такі заходи Білого дому, вжиті проти розвитку китайського технологічного сектора. "Ці чіпи мають вирішальне значення для технологічної бази та інноваційного потенціалу компанії", — пише видання interestingengineering.com.
На сьогодні відомо, що в обчислювальні ресурси ШІ-моделі DeepSeek-V3 вклали 6 млн доларів. Це невеликі кошти, порівняно з сумами, які вкладають у ШІ-технології американські компанії. Ба більше, чат-ботом DeepSeek можна користуватися безплатно, завантаживши, наприклад, застосунок в App Store, на відміну від ChatGPT, деякі послуги якого є платними. Аналітики ринку вважають, що DeepSeek має гарний потенціал, щоб конкурувати з американськими ШІ-моделями, маючи високу продуктивність за менших витрат, "кидаючи виклик поточним нормам та ініціюючи переоцінку в глобальній індустрії ШІ". Експерти не голослівні, адже версія бота DeepSeek R1 очолила рейтинг завантажень у всьому світі, у підсумку популярність інших ботів рекордно знизилася, через що підприємці на кшталт Дженсена Хуанга (співзасновник Nvidia), Майкла Делла (Dell), Ларрі Еллісона (Oracle) втратили 20,1 млрд доларів, 22,6 млрд доларів і 13 млрд доларів відповідно. Самим своїм існуванням DeepSeek довів, що можна створювати ефективний ШІ без використання дорогих процесорів і величезних сум грошей, пише bloomberg.com. Кластер, що складається з 10 тис. чипів Nvidia A100, керує всією системою.
Над китайським ШІ-ботом працює ціла група фахівців із High-Flyer, яка зосереджена на штучному інтелекті загального призначення (англ. Artificial General Intelligence — AGI, — ред.), про що заявляла ще на початку 2023 року.
Як з'явився DeepSeek
Можна сказати, що DeepSeek є "китайською відповіддю" на ChatGPT від OpenAI, який з'явився наприкінці 2022 року. Відтоді війна технологій між КНР і США перейшла в гарячу фазу, і китайські компанії всерйоз узялися за розробку конкурентоспроможних чат-ботів на основі ШІ. Незважаючи на зусилля таких гігантів, як Baidu, був очевидний помітний розрив у можливостях ШІ США і Китаю. КНР значно відставала в цій сфері.
Але у 2023 році ситуація змінилася докорінно. Проєкт DeepSeek зумів подолати технологічний розрив і досягти успіху в галузі AGI, який, як вважається, зможе в майбутньому перевершити людський інтелект. Не обійшлося і без значних інвестицій у розробку моделей DeepSeek-V3 і DeepSeek-R1, які швидко здобули визнання завдяки продуктивності, що конкурує з продуктами від OpenAI та Meta. І все це попри обмежений доступ компанії до новітніх чипів Nvidia.
Зокрема, DeepSeek-V3 виділяє швидкість виведення інформації та економічна ефективність. Бот досяг значних успіхів у галузях, що вимагають інтенсивних обчислювальних можливостей, як-от кодування та розв'язування математичних задач. Докладніше про цю ШІ-модель можна прочитати в статті, опублікованій на Arxiv, де було зазначено, що вона перевершує інші аналоги з відкритим вихідним кодом і відповідає можливостям провідних моделей із закритим вихідним кодом, таких як GPT-4 і Claude-3.5-Sonnet.
Чим DeepSeek відрізняється від чат-ботів на кшталт ChatGPT
DeepSeek відрізняється від інших застосунків на основі ШІ, таких як ChatGPT, архітектурою та експлуатаційними методами, які покликані підвищити ефективність і скоротити витрати. Використовуючи архітектуру "група експертів" (англ. Mixture of Experts — MoE, — ред.), китайський бот активує тільки певні частини своєї мережі для кожного конкретного запиту, значно заощаджуючи обчислювальну потужність і витрати. Це різко контрастує з архітектурою ChatGPT, яка обробляє завдання в усій своїй мережі, що призводить до більш високого споживання ресурсів.
Покращення технологій і продуктивності
Конструкція MoE дає змогу "ДіпСік" виконувати обробку, орієнтовану на конкретні завдання, що підвищує продуктивність у спеціалізованих галузях, як-от кодування та розв'язання технічних проблем, і прискорює час відгуку.
Навпаки, ChatGPT забезпечує більш стабільну продуктивність у широкому спектрі завдань, але може відставати у швидкості через комплексний метод обробки даних. Незважаючи на це, ChatGPT часто надає більш точні та контекстно багаті відповіді, забезпечуючи глибину, якої DeepSeek може не вистачати.
Налаштування та варіанти використання
Фреймворк DeepSeek є більш настроюваним, розроблений для задоволення користувачів, навички та експертність яких дає їм змогу ефективно керувати можливостями ШІ. Це робить модель придатною для спеціалізованих завдань, які потребують технічної допомоги.
З іншого боку, зручні для користувача параметри налаштування ChatGPT приваблюють ширшу аудиторію, роблячи його ідеальним для творчості, пошуку ідей і загального пошуку інформації.
Вартість і доступність
Що стосується доступності, відкритий вихідний код DeepSeek робить його повністю безкоштовним і легко доступним для модифікації та використання, що може бути особливо привабливим для спільноти розробників.
ChatGPT пропонує безкоштовну версію, але також має платні функції, надаючи доступ до більш просунутих можливостей API.
Користувацький досвід та етика
DeepSeek, хоча й потужний, вимагає від користувачів вищого рівня технічних навичок, що може завадити його популярності. А ось інтуїтивно зрозумілий інтерфейс ChatGPT і простіша модель взаємодії з користувачем забезпечують легшу криву навчання.
З етичної точки зору DeepSeek викликає побоювання через збір даних, включно зі зберіганням IP-адрес та інформації про пристрої, що суперечить стандартам GDPR. OpenAI, зі свого боку, робить наголос на анонімізацію і шифрування даних, щоб відповідати правилам конфіденційності.
Що означає успіх DeepSeek для світових ринків
Запуск моделі R1 DeepSeek буквально вразив світові фондові ринки, особливо зачепивши технологічний сектор. Так, індекс Nasdaq Composite різко впав на 3,1%, втративши понад 1 трлн доларів ринкової вартості.
За даними CNBC, цей спад був зумовлений збитками великих технологічних компаній. Наприклад, Nvidia втратила понад 600 млрд доларів ринкової вартості і зазнала найбільших збитків, коли-небудь зафіксованих для компанії, за один день. Це зрушення призвело до того, що Apple обігнала Nvidia і стала найдорожчою компанією в США, тоді як інші технологічні гіганти, на кшталт Google і Microsoft, також зазнали суттєвих збитків.
Енергетичний сектор також пережив помітний спад, викликаний побоюваннями інвесторів, що більш енергоефективна технологія DeepSeek може знизити загальний попит на енергію з боку технологічної галузі. Вартість акцій компаній GE Vernova і Vistra, що виробляють чисту енергію, впала на 21% і 28% відповідно.
Аналітики Волл-стріт уважно вивчають довгострокові наслідки появи DeepSeek як суперника для американських технологій у сфері ШІ. Нижчі витрати і знижені потреби в енергії цього чат-бота піднімають питання про стійкість високих ставок інвестицій у ШІ-технології з боку американських компаній, підкреслюючи потенційну перевитрату коштів у цьому секторі.
Деякі аналітики припускають, що реакція ринку може бути надто різкою, з огляду на збереження високого попиту на ШІ, який, як і раніше, вимагатиме значної інфраструктури. Крім того, геополітичні проблеми також відіграють свою роль, оскільки санкційна політика США не змогла зупинити розвиток китайського штучного інтелекту.
Чи варто турбуватися про конфіденційність
Незважаючи на технологічні досягнення, DeepSeek викликає такі ж побоювання, як і інші китайські платформи на кшталт TikTok. Річ у тім, що новий ШІ-бот збирає персональні дані користувачів, включно з датами народження, натисканнями клавіш, текстовими та аудіоповідомленнями, завантаженими файлами та історією чатів. Ця інформація зберігається на серверах у Китаї, пише interestingengineering.com.
Така практика викликає серйозні побоювання щодо безпеки та конфіденційності користувацьких даних, з огляду на закони Китаю, які зобов'язують усі організації співпрацювати з національними розвідувальними службами.
Експерти ринку кажуть, що "ДіпСік" потенційно може мати шкідливе ПЗ або механізм стеження, що може поставити під загрозу безпеку користувачів. Заходи безпеки DeepSeek було поставлено під сумнів після повідомлення про вразливість безпеки в грудні 2024 року, коли було знайдено вразливість, що давала змогу "захоплювати" акаунт, хоча згодом це було виправлено, повідомляє clickcontrol.com.
Ситуація загострилася, коли на тлі сплеску завантажень ШІ-бот став ціллю "масштабної шкідливої атаки", що вказує на триваючі проблеми безпеки. Цей інцидент підкреслює ризики, пов'язані з використанням DeepSeek, особливо щодо захисту персональних даних, які обробляє ШІ, пише theguardian.com.
Користувачі та розробники повинні враховувати ці ризики під час інтеграції та використання інструментів ШІ, таких як DeepSeek. У міру розвитку ШІ, забезпечення прозорості та надійних заходів безпеки матиме вирішальне значення для підтримки довіри користувачів і захисту особистої інформації від неправомірного використання.