[C1.5] MiniMax-M2 — базовая генерация HTML (неполный ответ)
Дополнительная информация
В тесте C1.5 мы проверяли MiniMax-M2 на совсем простой сценарий генерации HTML:
нужно было вернуть минимальный сниппет с заголовком <h1>Hello</h1> и абзацем <p>This is a test.</p>» строго без объяснений, комментариев и лишнего текста.
Модель начала рассуждать в thinking-блоке, обсуждать, что такое «валидный» HTML в контексте сниппета, и даже внутри рассуждений сформулировала правильный ответ. Однако отдать этот фрагмент в виде текста она не успела: ответ был обрезан по лимиту max_tokens на уровне reasoning, и в итоговом ответе HTML-кода нет.
Тест подсвечивает две важные особенности MiniMax-M2:
1) модель склонна «залипать» в рассуждениях даже на простых задачах форматирования;
2) небольшой лимит max_tokens приводит к тому, что до самого ответа модель просто не добирается.
Итог: тест C1.5 завершился с ошибкой (FAIL) — MiniMax-M2 не вернула требуемый HTML.