НОД 48 и 36 — тест MiniMax-M2

[M1.5] MiniMax-M2 — НОД чисел 48 и 36

Исходный запрос

НОД(48, 36) = ?

Полученный результат

1 прогон: 12
2 прогон: 12
3 прогон: 12
4 прогон: Для нахождения наибольшего общего делителя (НОД) чисел 48 и 36 можно использовать несколько методов... \boxed{12}
5 прогон: 12
6 прогон: {"reasoning": "...", "answer": "12"}
7 прогон: 12
8 прогон: 12
9 прогон: 12
10 прогон: The greatest common divisor (GCD) of 48 and 36 is... \boxed{12}

Ожидаемый результат

12

Выводы по работе модели

Вычислительная точность: высокая — математически правильный результат получен во всех прогонах.
Форматная дисциплина: слабая — в 30% случаев модель игнорирует системную инструкцию.
Типичная ошибка: добавление объяснений, LaTeX, JSON или англоязычного текста вместо чистого числа.
Поведение нестабильное: даже при temperature = 0.0 модель не удерживает формат

Дополнительная информация

Параметры запроса:

model: MiniMax-M2
temperature: 0.0
max_tokens: 200

Системная инструкция:

You are taking part in an automated benchmark.
Answer only with the final numerical result.
Do NOT include explanations, symbols, variables, or formatting.
Output a single number.
Комментарий:
MiniMax-M2 корректно решает элементарные задачи на НОД,
но непригоден для автоматических числовых бенчмарков без пост-валидации вывода.
Для продакшена требуется либо жёсткий output-фильтр, либо отдельный numeric-only режим модели

Информация

ID теста: 915

Тип:

Статус:

Модель: Minimax M2

Экосистема: MiniMax

Дата теста: 14.12.2025 13:54

Все тесты