[C2.2] MiniMax-M2 — тест генерации Python-модуля Inventory
Дополнительная информация
Поведение MiniMax-M2 под токенным давлением
В ходе тестирования выявлено, что MiniMax-M2 чувствительно реагирует на размер выделенного max_tokens, особенно при задачах, где требуется длинный reasoning-блок.
Это приводит к тому, что модель при недостаточном лимите:
-
не завершает цепочку рассуждений,
-
обрывает код или текст,
-
отдаёт пустой ответ,
-
формирует структуру без финального вывода,
-
либо нарушает формат ожидаемого решения.
Граница стабильности
Анализ серии прогонов с шагом увеличения лимита показывает:
| max_tokens | Поведение |
|---|---|
| 400–2000 | модель выдаёт неполные или пустые ответы, стабильности нет |
| 2400–3600 | редкие успешные ответы, но большинство прогонов нестабильные |
| 4000 | модель начинает правильно отвечать, но возможны единичные сбои |
| 4100 | фиксируется полная стабильность — 5/5 успешных прогонов |
Таким образом, порог устойчивой работы модели находится в диапазоне 4000–4100 токенов для данного типа задач.
Латентность
Наблюдались значительные колебания времени ответа:
-
3–4 секунды — быстрые прогоны при удачной выборке reasoning
-
10–20 секунд — стандартная задержка
-
30–40+ секунд — наблюдалась при прогонах, где reasoning близок к переполнению лимита
Это подтверждает, что модель тратит значительные ресурсы на внутренние вычисления перед ответом, и при недостатке места под вывод reasoning-блок подрезается.