MiniMax-M2: тест последней цифры степени

[M3.4] MiniMax-M2 — последняя цифра степени

Исходный запрос

Последняя цифра 7¹⁰⁰?

Полученный результат

Прогон 1:  1 (с пояснениями, LaTeX)
Прогон 2:  1
Прогон 3:  1 (с пояснениями)
Прогон 4:  1
Прогон 5:  1 
Прогон 6:  1
Прогон 7:  1 (с пояснениями)
Прогон 8:  1 (с пояснениями)
Прогон 9:  1 
Прогон 10:  1

Ожидаемый результат

1

Выводы по работе модели

MiniMax-M2 во всех прогонах корректно определяет последнюю цифру числа 7¹⁰⁰ — математический результат всегда равен 1. Ошибок в вычислениях не выявлено.

Тем не менее, в 4 из 10 прогонов модель нарушает формат ответа: добавляет пояснения, использует LaTeX и текстовые конструкции, несмотря на прямое требование вернуть только числовое значение. В рамках автоматической проверки это приводит к снижению pass rate и формальному провалу теста

Дополнительная информация

Параметры запроса

model: MiniMax-M2
temperature: 0.0
max_tokens: 200

Системная инструкция

You are a precise mathematical assistant.
Answer only with the final numerical result or exact expression as requested.
Do NOT add explanations, steps, or extra text.
Use plain numbers or exact math expressions.

Комментарий

Тест демонстрирует характерную особенность MiniMax-M2: высокая математическая точность при слабом соблюдении форматных ограничений. Для задач теории чисел базового уровня модель подходит по корректности вычислений, но требует дополнительного контроля формата при использовании в автоматизированных системах.

Информация

ID теста: 928

Тип:

Статус:

Модель: Minimax M2

Экосистема: MiniMax

Дата теста: 14.12.2025 19:41

Все тесты