DeepSeek откладывает запуск новой модели ИИ из-за проблем с чипами Huawei
DeepSeek откладывает запуск новой модели ИИ из-за проблем с чипами Huawei

DeepSeek откладывает запуск новой модели ИИ из-за проблем с чипами Huawei

DeepSeek откладывает запуск новой модели ИИ из-за проблем с чипами Huawei

Китайский стартап столкнулся с техническими ограничениями отечественных процессоров.

Китайская компания по искусственному интеллекту DeepSeek отложила запуск своей новой модели R2 после того, как не смогла успешно провести обучение на процессорах Ascend от Huawei. По словам трех источников Financial Times, знакомых с ситуацией, власти Китая настоятельно рекомендовали стартапу перейти на отечественные чипы вместо продукции Nvidia, но технические трудности заставили вернуться к использованию американского оборудования для ключевого этапа.

R2 планировали представить в мае 2025 года, однако неудачи при обучении модели на Ascend и более длительный, чем ожидалось, процесс маркировки данных привели к задержке. В результате компания потеряла позиции в пользу конкурентов.

После выпуска своей предыдущей модели R1 в январе, которая вызвала самое большое падение акций за один день в истории, DeepSeek получила от правительства сигнал переходить на локальные технологии - чипы Huawei Ascend и разработки компании Cambricon. Однако при попытке обучить R2 на Ascend инженеры столкнулись с рядом проблем: нестабильная работа, медленное соединение и менее эффективное программное обеспечение по сравнению с Nvidia.

В конце концов компания решила использовать чипы Nvidia для обучения, а Huawei Ascend - только для этапа инференса, то есть логического вывода, когда уже готовая модель генерирует ответы или прогнозы. Чтобы помочь решить проблемы, Huawei направила команду инженеров в офис DeepSeek. Однако даже в их присутствии обучение R2 на Ascend завершить не удалось.

Основатель DeepSeek Лян Вэньфэнг, по словам сотрудников компании, выразил недовольство прогрессом. Он настаивает на дополнительном времени для создания усовершенствованной модели, способной удержать лидерство на рынке ИИ.

Эксперты указывают, что китайские производители чипов значительно уступают американским в сложных задачах. Но исследователь Калифорнийского университета в Беркли Ритвик Гупта отмечает, что "модели - это товары, которые можно легко заменить". По его словам, многие разработчики уже используют Qwen3 от Alibaba, которая заимствует ключевые идеи DeepSeek, в частности алгоритм обучения, но реализует их эффективнее. Гупта также отметил, что Huawei пока проходит "проблемы роста" с использованием Ascend для обучения, однако ожидает, что компания со временем адаптирует свои чипы к потребностям ведущих моделей.

Параллельно власти Китая ввели новые ограничения на заказ американских чипов Nvidia H20. Технологическим компаниям теперь необходимо обосновывать закупки, чтобы стимулировать развитие внутренних альтернатив.

Сама Nvidia, которая оказалась в центре геополитического противостояния между Пекином и Вашингтоном, недавно согласилась отдавать часть доходов от продаж в Китае правительству США, чтобы возобновить поставки H20 на китайский рынок. В компании отмечают, что отказ от доступа к рынкам и сообществу разработчиков негативно повлияет на экономическую и национальную безопасность США.

DeepSeek продолжает работу с Huawei, чтобы сделать R2 совместимой с Ascend для этапа инференса. Китайские СМИ не исключают, что релиз может состояться в ближайшие недели, хотя точная дата зависит от завершения оптимизации и тестирования.

DeepSeek и Alibaba выпускают модели искусственного интеллекта с открытым исходным кодом, что позволяет свободно их загружать и изменять. Этот подход обеспечивает быстрое распространение китайских технологий и создает конкуренцию для американских разработчиков, таких как OpenAI, которые традиционно держали свои модели закрытыми. Подобная "гонка" за стандартизацию может иметь значительные геополитические последствия, ведь открытые модели ИИ становятся новым рычагом влияния, что заставляет Вашингтон пересматривать свою стратегию.

Источник материала
loader
loader