[M3.4] MiniMax-M2 — последняя цифра степени
Исходный запрос
Последняя цифра 7¹⁰⁰?
Полученный результат
Прогон 1: 1 (с пояснениями, LaTeX) Прогон 2: 1 Прогон 3: 1 (с пояснениями) Прогон 4: 1 Прогон 5: 1 Прогон 6: 1 Прогон 7: 1 (с пояснениями) Прогон 8: 1 (с пояснениями) Прогон 9: 1 Прогон 10: 1
Ожидаемый результат
1
Выводы по работе модели
MiniMax-M2 во всех прогонах корректно определяет последнюю цифру числа 7¹⁰⁰ — математический результат всегда равен 1. Ошибок в вычислениях не выявлено.
Тем не менее, в 4 из 10 прогонов модель нарушает формат ответа: добавляет пояснения, использует LaTeX и текстовые конструкции, несмотря на прямое требование вернуть только числовое значение. В рамках автоматической проверки это приводит к снижению pass rate и формальному провалу теста
Тем не менее, в 4 из 10 прогонов модель нарушает формат ответа: добавляет пояснения, использует LaTeX и текстовые конструкции, несмотря на прямое требование вернуть только числовое значение. В рамках автоматической проверки это приводит к снижению pass rate и формальному провалу теста
Дополнительная информация
Параметры запроса
model: MiniMax-M2
temperature: 0.0
max_tokens: 200
Системная инструкция
Комментарий
Тест демонстрирует характерную особенность MiniMax-M2: высокая математическая точность при слабом соблюдении форматных ограничений. Для задач теории чисел базового уровня модель подходит по корректности вычислений, но требует дополнительного контроля формата при использовании в автоматизированных системах.