[C1.2] MiniMax-M2 — генерация функции sum_to_n(n) (нарушение формата)
Дополнительная информация
В тесте C1.2 MiniMax-M2 должен был вернуть только код функции sum_to_n(n), без пояснений и рассуждений.
Однако модель проигнорировала формат: сгенерировала thinking-блок, начала рассуждать вслух, обсуждать варианты решения и
не выдала итоговый код. Ответ также был обрезан по max_tokens, что подчёркивает отсутствие контроля над длиной.
Этот тест показывает слабое место MiniMax-M2: при простых задачах на чистый код модель склонна нарушать формат и
возвращаться к внутреннему reasoning, даже когда это запрещено.
Итог: тест завершается со статусом FAIL.