MiniMax M2 — большая языковая модель нового поколения от компании MiniMax, ориентированная на задачи рассуждения, программирования и анализа. Модель активно используется через API и позиционируется как универсальная reasoning—LLM с поддержкой сложных многошаговых задач.
В отличие от многих моделей, MiniMax M2 демонстрирует ярко выраженное внутреннее рассуждение (reasoning), которое напрямую влияет на поведение при генерации ответов и потребление токенов. Именно поэтому модель была отдельно протестирована в условиях, максимально приближенных к реальному использованию в продакшене.
В рамках проекта Re:II Lab MiniMax M2 прошла серию практических тестов, включающих арифметические задачи, алгоритмы, генерацию Python-кода и работу со структурами данных. Все тесты запускались через API без искусственного занижения лимитов токенов, чтобы зафиксировать естественное поведение модели.
MiniMax M2 стабильно решает арифметические и логические задачи, даже при высокой сложности и необходимости многошаговых вычислений. При снятых ограничениях по токенам модель практически всегда доходит до финального ответа, хотя нередко сопровождает его развёрнутым reasoning. Это делает MiniMax M2 подходящей для задач анализа, объяснения и сложных вычислений, но требует аккуратной настройки лимитов в прикладных сценариях.
Отдельное внимание было уделено кодогенерации на Python. В тестах использовались задачи, приближённые к реальным интервью и рабочим ситуациям: фильтрация и сортировка данных, алгоритмы со скользящим окном, классы с состоянием, структуры данных (Inventory, LRUCache), а также полноценный парсер арифметических выражений.
По результатам тестирования MiniMax M2 показала себя как сильная инженерная модель:
- корректно генерирует рабочий Python-код;
- уверенно справляется со структурами данных;
- способна реализовывать рекурсивные алгоритмы и парсеры;
- редко допускает логические ошибки в коде;
- сохраняет структуру и читаемость решений.
В сложных задачах MiniMax M2 демонстрирует более устойчивое архитектурное мышление по сравнению с рядом альтернативных моделей, особенно при работе с классами, состоянием и вложенной логикой.
При этом у модели есть особенности, которые важно учитывать. MiniMax M2 практически всегда выполняет внутреннее reasoning, даже если в системном промпте явно указано не показывать ход рассуждений. Это приводит к увеличенному расходу токенов и нестабильности при жёстких лимитах max_tokens. В ряде случаев при низких лимитах модель может «застрять» в reasoning и не успеть выдать финальный ответ.
На практике это означает, что MiniMax M2 лучше использовать:
- либо с повышенными лимитами токенов;
- либо в задачах, где допустим развёрнутый ответ;
- либо с последующей постобработкой результата.
При снятии лимитов модель ведёт себя значительно стабильнее и демонстрирует высокий процент успешных решений.
По совокупности результатов MiniMax M2 можно охарактеризовать как сильную reasoning-модель с хорошей кодовой компетенцией, подходящую для:
- аналитических задач;
- сложных вычислений;
- генерации и анализа кода;
- экспериментов и исследовательских сценариев;
- лабораторного и сравнительного тестирования моделей.
Подробные примеры тестов, сравнения с другими моделями и результаты прогонов доступны в экосистеме MiniMax и разделе лаборатории Re:II Lab.