MiniMax M2 — тест предела e

[M3.2] MiniMax-M2 — предел (1 + 1/n)ⁿ

Исходный запрос

lim(n→∞) (1 + 1/n)ⁿ = ?

Полученный результат

1 прогон: e (LaTeX: e)
2 прогон:  e
3 прогон:  e (LaTeX: e)
4 прогон:  e (развёрнутое объяснение + LaTeX, нарушение формата)
5 прогон: e («approximately 2.71828», лишний текст)
6 прогон: e (развёрнутое объяснение, нарушение формата)
7 прогон: e (развёрнутое объяснение, нарушение формата)
8 прогон: e (LaTeX: e)
9 прогон: e (развёрнутое объяснение, нарушение формата)
10 прогон: e

Ожидаемый результат

e (допускается 2.718… по критерию, но эталон — символ e)

Выводы по работе модели

MiniMax-M2 во всех 10 прогонах возвращает корректный результат предела — e (математическая константа). С вычислительной точки зрения тест пройден уверенно: ошибок по сути задачи нет, результат стабилен.

Ключевая проблема — формат ответа. При заданном системном требовании «без пояснений» модель в ряде прогонов уходит в многостраничные доказательства, активно использует LaTeX и текстовые вставки, что увеличивает расход токенов и сильно бьёт по предсказуемости вывода в автоматическом пайплайне. Типичный паттерн MiniMax-M2: чем больше доступный контекст, тем выше вероятность «reasoning-развёртки» даже на задачах, где нужен один символ

Дополнительная информация

model: MiniMax-M2
temperature: 0.0
max_tokens: 200

Системная инструкция

You are a precise mathematical assistant.
Answer only with the final numerical result or exact expression as requested.
Do NOT add explanations, steps, or extra text.
Use plain numbers or exact math expressions.

Комментарий

Тест M3.2 подтверждает, что MiniMax-M2 корректно знает и стабильно воспроизводит базовые пределы математического анализа. Но одновременно усиливается ранее замеченный эффект: модель часто «перепроизводит» reasoning-контент и оформляет ответ как мини-лекцию, даже когда требуется один символ. Для задач с жёстким форматом вывода потребуется либо постобработка, либо более жёсткая инструкция/ограничение по токенам.

Информация

ID теста: 926

Тип:

Статус:

Модель: Minimax M2

Экосистема: MiniMax

Дата теста: 14.12.2025 19:13

Все тесты