[C2.2] MiniMax-M2 — тест генерации Python-модуля Inventory

Дополнительная информация

Поведение MiniMax-M2 под токенным давлением

В ходе тестирования выявлено, что MiniMax-M2 чувствительно реагирует на размер выделенного max_tokens, особенно при задачах, где требуется длинный reasoning-блок.
Это приводит к тому, что модель при недостаточном лимите:

не завершает цепочку рассуждений,
обрывает код или текст,
отдаёт пустой ответ,
формирует структуру без финального вывода,
либо нарушает формат ожидаемого решения.

Граница стабильности

Анализ серии прогонов с шагом увеличения лимита показывает:

max_tokens	Поведение
400–2000	модель выдаёт неполные или пустые ответы, стабильности нет
2400–3600	редкие успешные ответы, но большинство прогонов нестабильные
4000	модель начинает правильно отвечать, но возможны единичные сбои
4100	фиксируется полная стабильность — 5/5 успешных прогонов

Таким образом, порог устойчивой работы модели находится в диапазоне 4000–4100 токенов для данного типа задач.

Латентность

Наблюдались значительные колебания времени ответа:

3–4 секунды — быстрые прогоны при удачной выборке reasoning
10–20 секунд — стандартная задержка
30–40+ секунд — наблюдалась при прогонах, где reasoning близок к переполнению лимита

Это подтверждает, что модель тратит значительные ресурсы на внутренние вычисления перед ответом, и при недостатке места под вывод reasoning-блок подрезается.

Информация

ID теста: 838

Тип: Coding / Код

Статус: pass

Модель: Minimax M2

Экосистема: MiniMax

Дата теста: 10.12.2025 17:36

Все тесты

Экосистемы