MiniMax-M2 тест линейного уравнения

[M1.3] MiniMax-M2 — линейное уравнение 2x + 5 = 17

Исходный запрос

2x + 5 = 17. Найди x.

Полученный результат

Прогон 1: 6
Прогон 2: 6
Прогон 3: x = 6
Прогон 4: развёрнутое решение → финал 6
Прогон 5: 6
Прогон 6: развёрнутое решение → финал 6
Прогон 7: 6
Прогон 8: 6
Прогон 9: x = 6
Прогон 10: x = 6

Ожидаемый результат

6

Выводы по работе модели

MiniMax-M2 корректно решает простые линейные уравнения уровня начальной алгебры. Во всех прогонах модель пришла к правильному значению переменной, однако в 20% случаев проигнорировала системную инструкцию и выдала развернутое текстовое объяснение.

Это указывает не на математическую ошибку, а на нестабильное соблюдение формата ответа при низкой сложности задачи. Для строгих числовых бенчмарков требуется дополнительное ужесточение контроля формата на уровне постобработки или системного промпта

Дополнительная информация

Итоговая оценка

  • Score: 90 / 100

  • Консистентность: высокая по результату, средняя по формату

  • Вердикт: математически корректно, формат нестабилен


Доп. блок: параметры и формат запроса

Параметры запроса:

model: MiniMax-M2
temperature: 0.0
max_tokens: 200

Системная инструкция:

You are taking part in an automated benchmark.
Answer only with the final numerical result.
Do NOT include explanations, symbols, variables, or formatting.
Output a single number.

Комментарий:


Даже при наличии жёсткой инструкции модель периодически возвращается к объяснительному стилю. Для тестов типа number рекомендуется дополнительная фильтрация ответа (regex / parser) или отказ от задач с буквенными переменными в базовой арифметической группе

Информация

ID теста: 912

Тип:

Статус:

Модель: Minimax M2

Экосистема: MiniMax

Дата теста: 14.12.2025 13:44

Все тесты