[C1.7] MiniMax-M2 — базовая генерация CSS-кнопки (неполный ответ)
Дополнительная информация
В тесте C1.7 мы проверяли MiniMax-M2 на простую задачу фронтенд-практики: сгенерировать чистый CSS-класс .btn-primary с базовыми свойствами (синий фон, белый текст, padding 12px, border-radius 5px, тёмный hover), строго без HTML, комментариев и пояснений.
Модель начала подробно рассуждать в скрытом thinking-блоке: выбирала конкретные оттенки синего, обсуждала формат CSS и даже проговаривала, каким должен быть итоговый код. Однако из-за длинного reasoning и ограничения по max_tokens ответ был обрезан ещё до того, как модель успела вывести CSS-текст.
В результате финальный ответ не содержит ни одной CSS-строки, а тест считается проваленным. Повторный прогон с увеличенным лимитом до 400 токенов привёл к похожему поведению: модель снова застряла в размышлениях и не выдала готовый код.
Этот тест показывает важный нюанс MiniMax-M2: при строгих требованиях к формату («CSS only») модель может переоценивать важность внутренних рассуждений и не успевать перейти к генерации результата. Для практических задач генерации небольших сниппетов это снижает надёжность модели по сравнению с более дисциплинированными LLM.