Мощная ИИ-модель, которая несколько дней назад появилась на платформе OpenRouter, как стало известно, принадлежит китайской компании Xiaomi. Ранее её появление породило слухи о том, что это стартап DeepSeek без лишнего шума тестирует свою новую языковую модель.

Обзор Samsung Galaxy Z TriFold: тройной складной смартфон по цене квартиры в Воркуте

Обзор ноутбука HONOR MagicBook X16 2026: как раньше, только лучше

Ryzen и 16 Гбайт DDR5: как сэкономить на памяти так, чтобы не лишиться 15 % производительности

Компьютер месяца, спецвыпуск: эпоха отката, или Как дефицит чипов памяти влияет на выбор железа для игрового ПК

Гид по выбору OLED-монитора в 2026 году: эволюция в деталях

Обзор Ryzen 7 9850X3D: три процента за двадцать баксов

Запуск недорогих ИИ-моделей DeepSeek-V3 и DeepSeek-R1 в прошлом году вызвал падение курса акций технологических компаний по всему миру, заставив инвесторов усомниться в необходимости тратить миллиарды долларов на вычислительные мощности для ИИ. С тех пор рынок с огромным интересом ожидает запуска алгоритма DeepSeek-V4, чтобы оценить новые достижения китайского стартапа.
Ранее в этом месяце на платформе OpenRouter появилась загадочная бесплатная ИИ-модель Hunter Alpha, разработчик которой не был указан. Теперь же подразделение Xiaomi по разработке ИИ, которое возглавляет бывший инженер DeepSeek Ло Фули (Luo Fuli), объявило, что Hunter Alpha была «ранней внутренней тестовой сборкой MiMo-V2-Pro» — флагманской ИИ-модели компании, которая оптимизирована для обработки агентских задач. Релиз новой модели Xiaomi происходит на фоне растущей популярности фреймворка OpenClaw, который предназначен для создания ИИ-агентов, способных выполнять разные действия от имени пользователей, и который становится всё более популярным в Китае.

«Я называю это тихой засадой — не потому, что мы это планировали, а потому что сдвиг парадигмы от чатов к агентам произошёл так быстро, что даже мы сами с трудом в это поверили. Люди спрашивают, почему мы действуем так быстро. Я видела это своими глазами, работая над созданием DeepSeek-R1», — написала недавно Ло Фули в соцсети X.
MiMo-V2-Pro поддерживает пять основных фреймворков для создания ИИ-агентов, включая OpenClaw. Разработчики смогут в тестовом режиме задействовать алгоритм бесплатно в течение недели. На фоне анонса флагманской ИИ-модели акции Xiaomi на бирже в Гонконге выросли в цене на 5,8 %.
Появившийся на прошлой неделе алгоритм Hunter Alpha описывал себя, как «китайскую ИИ-модель, обученную в основном на китайском языке». Он также сообщал, что для обучения использовались данные, охватывающие период до мая 2025 года, т.е. такой же временной отсечки, о которой сообщал чат-бот DeepSeek. Однако на вопрос о своём создателе алгоритм отвечать отказывался. «Я знаю только своё имя, масштаб параметров и размер контекстного окна», — сообщала Hunter Alpha. В описании говорилось, что это модель с 1 трлн параметров и контекстным окном в 1 млн токенов.

«MiMo-V2-Pro — это наша флагманская базовая модель, созданная для реальных агентских нагрузок. Она спроектирована таким образом, чтобы выполнять роль «мозга» в агентских системах: координировать сложные рабочие процессы, управлять производственными инженерными задачами и выдавать надёжные результаты», — говорится в пресс-релизе Xiaomi.
В глобальном рейтинге бенчмарка Artificial Analysis Intelligence модель MiMo-V2-Pro заняла восьмое место, а среди китайских языковых моделей поднялась на вторую позицию. Модель имеет более 1 трлн параметров, из которых 42 млрд — активные, что примерно втрое больше, чем у компактной версии MiMo-V2-Flash, а также контекстное окно в 1 млн токенов.
Xiaomi отметила высокие результаты MiMo-V2-Pro во всех основных агентских тестах. В области генерации программного кода алгоритм превзошёл Claude 4.6 Sonnet, а общая производительность при выполнении агентских задач близка к показателю Opus 4.6. Стабильность работы и точность вызова инструментов существенно улучшились по сравнению с предыдущей версией. Этого удалось добиться за счёт оптимизации процесса обучения. В дальнейшем разработчики планируют сосредоточиться на повышении эффективности при обработке задач высокой сложности, которые требуют рассуждений, долгосрочного планирования и систематического принятия решений.



Добавить комментарий