[M1.3] MiniMax-M2 — линейное уравнение 2x + 5 = 17
Исходный запрос
2x + 5 = 17. Найди x.
Полученный результат
Прогон 1: 6 Прогон 2: 6 Прогон 3: x = 6 Прогон 4: развёрнутое решение → финал 6 Прогон 5: 6 Прогон 6: развёрнутое решение → финал 6 Прогон 7: 6 Прогон 8: 6 Прогон 9: x = 6 Прогон 10: x = 6
Ожидаемый результат
6
Выводы по работе модели
MiniMax-M2 корректно решает простые линейные уравнения уровня начальной алгебры. Во всех прогонах модель пришла к правильному значению переменной, однако в 20% случаев проигнорировала системную инструкцию и выдала развернутое текстовое объяснение.
Это указывает не на математическую ошибку, а на нестабильное соблюдение формата ответа при низкой сложности задачи. Для строгих числовых бенчмарков требуется дополнительное ужесточение контроля формата на уровне постобработки или системного промпта
Это указывает не на математическую ошибку, а на нестабильное соблюдение формата ответа при низкой сложности задачи. Для строгих числовых бенчмарков требуется дополнительное ужесточение контроля формата на уровне постобработки или системного промпта
Дополнительная информация
Итоговая оценка
-
Score: 90 / 100
-
Консистентность: высокая по результату, средняя по формату
-
Вердикт: математически корректно, формат нестабилен
Доп. блок: параметры и формат запроса
Параметры запроса:
Системная инструкция:
Комментарий:
Даже при наличии жёсткой инструкции модель периодически возвращается к объяснительному стилю. Для тестов типа number рекомендуется дополнительная фильтрация ответа (regex / parser) или отказ от задач с буквенными переменными в базовой арифметической группе