[M3.3] MiniMax-M2 — определитель матрицы 3×3
Исходный запрос
Определитель матрицы [[1,2,3],[4,5,6],[7,8,9]] = ?
Полученный результат
Прогон 1: 0 Прогон 2: 0 (с развёрнутым объяснением) Прогон 3: 0 Прогон 4: 0 Прогон 5: 0 Прогон 6: 0 (с объяснением) Прогон 7: 0 Прогон 8: 0 (с объяснением) Прогон 9: 0 (с объяснением) Прогон 10: 0
Выводы по работе модели
MiniMax-M2 корректно вычисляет определитель матрицы и во всех 10 прогонах приходит к правильному математическому результату — 0. Ошибок в самих вычислениях не выявлено.
Однако в 4 из 10 прогонов модель игнорирует системную инструкцию и возвращает развёрнутое рассуждение с формулами и пояснениями. Для задач с типом ответа number это является критическим нарушением формата, из-за чего тест формально считается не пройденным.
Таким образом, модель демонстрирует:
высокую математическую корректность;
низкую устойчивость к ограничениям формата вывода в reasoning-режиме
Однако в 4 из 10 прогонов модель игнорирует системную инструкцию и возвращает развёрнутое рассуждение с формулами и пояснениями. Для задач с типом ответа number это является критическим нарушением формата, из-за чего тест формально считается не пройденным.
Таким образом, модель демонстрирует:
высокую математическую корректность;
низкую устойчивость к ограничениям формата вывода в reasoning-режиме