MiniMax M2 провал базового HTML теста

[C1.5] MiniMax-M2 — базовая генерация HTML (неполный ответ)

Дополнительная информация

В тесте C1.5 мы проверяли MiniMax-M2 на совсем простой сценарий генерации HTML:
нужно было вернуть минимальный сниппет с заголовком <h1>Hello</h1> и абзацем <p>This is a test.</p>» строго без объяснений, комментариев и лишнего текста.

Модель начала рассуждать в thinking-блоке, обсуждать, что такое «валидный» HTML в контексте сниппета, и даже внутри рассуждений сформулировала правильный ответ. Однако отдать этот фрагмент в виде текста она не успела: ответ был обрезан по лимиту max_tokens на уровне reasoning, и в итоговом ответе HTML-кода нет.

Тест подсвечивает две важные особенности MiniMax-M2:
1) модель склонна «залипать» в рассуждениях даже на простых задачах форматирования;
2) небольшой лимит max_tokens приводит к тому, что до самого ответа модель просто не добирается.

Итог: тест C1.5 завершился с ошибкой (FAIL) — MiniMax-M2 не вернула требуемый HTML.

Информация

ID теста: 816

Тип:

Модель: Minimax M2

Экосистема: MiniMax

Дата теста: 09.12.2025 11:13

Все тесты