Xiaomi запустила свою первую ИИ-модель MiMo на 7 млрд параметров
Xiaomi запустила свою первую ИИ-модель MiMo на 7 млрд параметров

Xiaomi запустила свою первую ИИ-модель MiMo на 7 млрд параметров

Xiaomi запустила свою первую ИИ-модель MiMo на 7 млрд параметров - Фото 1

Китайский производитель смартфонов и электрокаров Xiaomi представил первую собственную разработку языковой модели искусственного интеллекта MiMo.

Эта модель имеет открытый исходный код и включает в себя 7 млрд различных параметров. Утверждается, что по результатам тестов на производительность MiMo обошла o1-mini от OpenAI и QwQ-32B-Preview от Alibaba Group.

В Xiaomi заявляют, что первая большая языковая модель компании разрабатывалась с использованием обучения и подкрепления со стороны специализированной целевой группы по ИИ под названием Core. До этого китайские СМИ сообщали, что в декабре прошлого года компания приобрела около 10 тыс. графических процессоров для обучения MiMo.

Кроме этого в Xiaomi пытались нанять на работу Ло Фули — разработчицу другой китайской модели ИИ DeepSeek. Однако девушка отказалась. Между тем амбиции Xiaomi включают стремление создать общую модель искусственного интеллекта. Хотя компания представила MiMo позже моделей от DeepSeek и Alibaba, там убеждены, что успеют сравняться с конкурентами в гонке за создание AGI.

Между тем в OpenAI заявляют, что их последняя модель ИИ GPT-4.5, выпущенная в феврале, первая, вызывающая впечатление общения с вдумчивым человеком. Крупные технологические компании вкладывают миллиарды в инфраструктуру искусственного интеллекта.

Ожидается, что в этом году совокупные капитальные затраты Microsoft, Amazon, Google и Meta составят $320 млрд для расширения возможностей в сфере искусственного интеллекта. Со своей стороны Google обновила семейство «открытых» моделей Gemma AI и представила Gemma 3— самый мощный ИИ на сегодня, по словам самой компании, который можно запустить на одной видеокарте.

Калифорнийский стартап Inception Labs представив первую в мире большую языковую модель на основе диффузии, разработанную для коммерческого использования. Диффузия — это техника, которую искусственный интеллект обычно использует для генерации изображений и видео. Диффузия работает иначе — она не движется слева направо, а создает весь текст одновременно. При этом все начинается с «шума», который постепенно очищается и получается поток токенов.

Источник: South China Morning Post

Xiaomi запустила свою первую ИИ-модель MiMo на 7 млрд параметров - Фото 2
Теги по теме
Xiaomi
Источник материала
loader