MiniMax M2 тест генерации sum_to_n ошибка

[C1.2] MiniMax-M2 — генерация функции sum_to_n(n) (нарушение формата)

Дополнительная информация

В тесте C1.2 MiniMax-M2 должен был вернуть только код функции sum_to_n(n), без пояснений и рассуждений.
Однако модель проигнорировала формат: сгенерировала thinking-блок, начала рассуждать вслух, обсуждать варианты решения и
не выдала итоговый код. Ответ также был обрезан по max_tokens, что подчёркивает отсутствие контроля над длиной.

Этот тест показывает слабое место MiniMax-M2: при простых задачах на чистый код модель склонна нарушать формат и
возвращаться к внутреннему reasoning, даже когда это запрещено.

Итог: тест завершается со статусом FAIL.

Информация

ID теста: 813

Тип:

Модель: Minimax M2

Экосистема: MiniMax

Дата теста: 09.12.2025 10:51

Все тесты