MiniMax M2 JavaScript тест: порог reasoning

[C1.8] MiniMax-M2 — функция capitalizeFirstLetter в JavaScript (порог устойчивости reasoning)

Дополнительная информация

В тесте C1.8 MiniMax-M2 должна была выполнить простое задание —
сгенерировать лаконичную JavaScript-функцию capitalizeFirstLetter строго в формате
«код без пояснений».

Однако поведение модели оказалось чувствительным к лимиту токенов:

  • При максимуме 400 токенов MiniMax-M2 не смогла перейти от reasoning к финальному коду.
  • Модель несколько раз переосмысливала Unicode, edge cases и форматы запуска,
    из-за чего весь бюджет ушёл на внутренние размышления.
  • Код не был сгенерирован — тест провален.
  • При увеличении лимита до 1000 токенов модель наконец завершила рассуждение
    и выдала корректную JS-функцию.

Итог: MiniMax-M2 технически умеет решать задачу, но демонстрирует
чрезмерный объём reasoning, требующий увеличенного контекста.
Для стабильного получения кода рекомендуется max_tokens ≥ 800–1000.

Информация

ID теста: 819

Тип:

Модель: Minimax M2

Экосистема: MiniMax

Дата теста: 09.12.2025 11:43

Все тесты