MiniMax M2 тест C2.2 Inventory модуль

[C2.2] MiniMax-M2 — тест генерации Python-модуля Inventory

Дополнительная информация

Поведение MiniMax-M2 под токенным давлением

В ходе тестирования выявлено, что MiniMax-M2 чувствительно реагирует на размер выделенного max_tokens, особенно при задачах, где требуется длинный reasoning-блок.
Это приводит к тому, что модель при недостаточном лимите:

  • не завершает цепочку рассуждений,

  • обрывает код или текст,

  • отдаёт пустой ответ,

  • формирует структуру без финального вывода,

  • либо нарушает формат ожидаемого решения.

Граница стабильности

Анализ серии прогонов с шагом увеличения лимита показывает:

max_tokens Поведение
400–2000 модель выдаёт неполные или пустые ответы, стабильности нет
2400–3600 редкие успешные ответы, но большинство прогонов нестабильные
4000 модель начинает правильно отвечать, но возможны единичные сбои
4100 фиксируется полная стабильность — 5/5 успешных прогонов

Таким образом, порог устойчивой работы модели находится в диапазоне 4000–4100 токенов для данного типа задач.

Латентность

Наблюдались значительные колебания времени ответа:

  • 3–4 секунды — быстрые прогоны при удачной выборке reasoning

  • 10–20 секунд — стандартная задержка

  • 30–40+ секунд — наблюдалась при прогонах, где reasoning близок к переполнению лимита

Это подтверждает, что модель тратит значительные ресурсы на внутренние вычисления перед ответом, и при недостатке места под вывод reasoning-блок подрезается.

Информация

ID теста: 838

Тип:

Статус:

Модель: Minimax M2

Экосистема: MiniMax

Дата теста: 10.12.2025 17:36

Все тесты