Компания DeepSeek полностью финансируется китайским бизнесменом Ляном Вэньфэном. Чат-бот использует более дешевые чипы. Он ставит под сомнение доминирование Соединенных Штатов Америки в области искусственного интеллекта.
Китайский чатбот DeepSeek, запущенный на прошлой неделе, стал самым загружаемым приложением в США, опередив ChatGPT от Open AI. Это вызвало падение акций крупных американских технокомпаний. В частности, акции Nvidia, Microsoft и Meta заметно снизились в цене на фоне успеха конкурента. Об этом пишет BBC.
Внезапная популярность DeepSeek поразила фондовые рынки в Европе и США. Акции европейских и американских компаний, связанных с AI, таких как ASML и Siemens Energy, потеряли в стоимости до 10% и 21% соответственно. Эксперты объясняют, что появление низкобюджетной модели может поставить под сомнение рентабельность значительных инвестиций американских компаний в дорогие AI-технологии.
Кто основал DeepSeek?
Стартап DeepSeek, основанный в 2023 году китайским предпринимателем Лянем Вэньфэном, который также возглавляет хедж-фонд High-Flyer. Он поставил перед своей компанией амбициозную цель — создавать открытые модели ИИ, доступные для разработчиков всего мира.
Главной особенностью модели DeepSeek R1 является способность формулировать логические рассуждения перед предоставлением ответа, что выгодно отличает ее среди конкурентов, таких как ChatGPT от OpenAI. Кроме этого, DeepSeek предоставляет лицензии для дальнейшего совершенствования технологии.
DeepSeek R1 была создана за значительно меньшие средства, чем аналоги от OpenAI и Meta AI. В компании заявили, что затраты на разработку составили всего 5,576 млн долларов, тогда как OpenAI потратила около 100 млн долларов только на обучение GPT-4.
Модель демонстрирует высокую производительность по следующим ключевым тестам:
- AIME 2024 (решение математических задач),
- MMLU (оценка общих знаний),
- AlpacaEval 2.0 (вопросы-ответы).
Секрет экономической эффективности DeepSeek заключается в использовании комбинации среднеклассовых чипов Nvidia H800 и открытого исходного кода, что существенно уменьшило затраты на вычислительные ресурсы.