/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2F1adbbcdb6086e19245a8fd1102955385.jpg)
Xiaomi запустила свою первую ИИ-модель MiMo на 7 млрд параметров
/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2F21839a7b2e39e3a0a4e255cec1625515.png)
Китайский производитель смартфонов и электрокаров Xiaomi представил первую собственную разработку языковой модели искусственного интеллекта MiMo.
Эта модель имеет открытый исходный код и включает в себя 7 млрд различных параметров. Утверждается, что по результатам тестов на производительность MiMo обошла o1-mini от OpenAI и QwQ-32B-Preview от Alibaba Group.
В Xiaomi заявляют, что первая большая языковая модель компании разрабатывалась с использованием обучения и подкрепления со стороны специализированной целевой группы по ИИ под названием Core. До этого китайские СМИ сообщали, что в декабре прошлого года компания приобрела около 10 тыс. графических процессоров для обучения MiMo.
Кроме этого в Xiaomi пытались нанять на работу Ло Фули — разработчицу другой китайской модели ИИ DeepSeek. Однако девушка отказалась. Между тем амбиции Xiaomi включают стремление создать общую модель искусственного интеллекта. Хотя компания представила MiMo позже моделей от DeepSeek и Alibaba, там убеждены, что успеют сравняться с конкурентами в гонке за создание AGI.
Между тем в OpenAI заявляют, что их последняя модель ИИ GPT-4.5, выпущенная в феврале, первая, вызывающая впечатление общения с вдумчивым человеком. Крупные технологические компании вкладывают миллиарды в инфраструктуру искусственного интеллекта.
Ожидается, что в этом году совокупные капитальные затраты Microsoft, Amazon, Google и Meta составят $320 млрд для расширения возможностей в сфере искусственного интеллекта. Со своей стороны Google обновила семейство «открытых» моделей Gemma AI и представила Gemma 3— самый мощный ИИ на сегодня, по словам самой компании, который можно запустить на одной видеокарте.
Калифорнийский стартап Inception Labs представив первую в мире большую языковую модель на основе диффузии, разработанную для коммерческого использования. Диффузия — это техника, которую искусственный интеллект обычно использует для генерации изображений и видео. Диффузия работает иначе — она не движется слева направо, а создает весь текст одновременно. При этом все начинается с «шума», который постепенно очищается и получается поток токенов.
Источник: South China Morning Post
/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2F21839a7b2e39e3a0a4e255cec1625515.png)
