MiniMax M2 тест логики Монти Холла

[R3.1] MiniMax-M2 — задача Монти Холла (вероятностное reasoning)

Исходный запрос

(
    model="MiniMax-M2",
    max_tokens=4096,
    temperature=0.3,
    messages=[{"role": "user", "content": test['3 двери: 1 приз, 2 козы. Выбрал дверь 1. Ведущий открыл дверь 3 (коза). Вероятность выигрыша при смене на дверь 2?
']}]
)

Полученный результат

2/3

Ожидаемый результат

Модель должна:

Корректно определить вероятность выигрыша при смене двери
Вернуть значение 2/3, 0.67, 67% или 66.7%
Не допустить типичную ошибку ответа 1/2
Не уходить в рассуждения (формат one_word)

Выводы по работе модели

MiniMax-M2 корректно решил классическую задачу Монти Холла, сразу выдав правильную вероятность выигрыша при смене двери. Ответ полностью соответствует критерию успеха и формату теста.

Модель не попала в распространённую логическую ловушку, связанную с интуитивным, но неверным выводом о равной вероятности (1/2), что говорит о корректном вероятностном reasoning даже без развёрнутых рассуждений

Дополнительная информация

Тест R3.1 показывает, что MiniMax-M2 уверенно справляется с базовыми вероятностными парадоксами и классическими логическими задачами. Даже при минималистичном формате ответа модель демонстрирует правильное понимание структуры задачи и устойчивость к интуитивным ошибкам.

MiniMax-M2 можно считать надёжным для задач прикладного reasoning, логических проверок и тестов на корректность вероятностных выводов, по крайней мере на уровне стандартных академических головоломок.

Информация

ID теста: 892

Тип:

Статус:

Модель: Minimax M2

Экосистема: MiniMax

Дата теста: 13.12.2025 22:47

Все тесты