MiniMax-M2: IMO тест функционального уравнения

[M5.5] MiniMax-M2 — IMO задача (функциональное уравнение)

Исходный запрос

Найди все функции f:ℝ→ℝ такие что f(x² + f(y)) = y + f(x)² для всех x, y ∈ ℝ.

Полученный результат

1 прогон: заявил 𝑓(𝑥)=𝑥 и что единственное — по смыслу ок, но рассуждения местами кривые/скачкообразные
2 прогон: ошибка — заявил «решений нет», противоречит корректным прогонам и известному решению 𝑓(𝑥)==x
3 прогон: корректно — 𝑓(𝑥)=x как единственное, с разбором через инъективность/инволюцию
4 прогон: корректно — f(x)=x как единственное, большой разбор (много лишнего, но итог верный)
5 прогон: fail/пусто — ответа нет (таймаут/обрыв, 20000 токенов)
6 прогон: fail/пусто — ответа нет (таймаут/обрыв, 20000 токенов)
7 прогон: fail/пусто — ответа нет (таймаут/обрыв, 20000 токенов)
8 прогон: fail/пусто — ответа нет (таймаут/обрыв, 20000 токенов)
9 прогон: корректно по выводу — f(x)=x единственная, но внутри много сомнительных утверждений (монотонность «из воздуха», корни и т.п.)
10 прогон: корректно — коротко: f(x)=x единственная

Ожидаемый результат

Единственные решения: 
𝑓(𝑥)=𝑥 и/или 𝑓(𝑥)=−𝑥 (проверка/отсев подстановками)

В ответе должна прозвучать «единственные решения» и идея подстановок (x=0, y=0, подбор y для зануления)

Выводы по работе модели

MiniMax-M2 умеет находить правильное решение для сложного олимпиадного функционального уравнения: в большинстве завершённых прогонов модель приходит к выводу, что единственное решение — f(x)=x. Однако стабильность плохая: один прогон дал ложный вывод «решений нет», а 4 прогона вообще не вернули ответ (обрыв/лимит 20000 токенов), что критично для задач высокой сложности.
Отдельно видно, что системная инструкция «без объяснений» не соблюдается: успешные прогоны часто уходят в длинные доказательства и раздувают токены до лимита.

Дополнительная информация

Параметры запроса

  • model: MiniMax-M2

  • temperature: 0.0

  • max_tokens: 20000

Системная инструкция
You are a precise mathematical assistant.
Answer only with the final numerical result or exact expression as requested.
Do NOT add explanations, steps, or extra text. Use plain numbers or exact math expressions.

Комментарий
В связи с ярко выраженным CoT в ответах увеличили максимальный лимит токенов до 20000, периодически для получения итогового ответа данного лимита не хватало.
Тест частично пройден (верный ответ часто найден), но по стабильности и формату — провалы: есть ложный ответ и множественные обрывы на лимите токенов

Информация

ID теста: 952

Тип:

Статус: ,

Модель: Minimax M2

Экосистема: MiniMax

Дата теста: 15.12.2025 19:19

Все тесты