Статус: pass

Инструменты

[R3.4] MiniMax-M2 — парадокс лжеца

Вывод по тесту R3.4 Тест показал, что MiniMax-M2 уверенно распознаёт самореферентные логические парадоксы и корректно работает с противоречиями в рамках классической логики. Модель не…

13.12.2025

Читать →

Инструменты

[R3.3] MiniMax-M2 — логическая задача «12 шаров»

Тест «12 шаров» показал, что MiniMax-M2 корректно решает классические дедуктивные задачи, требующие многошагового логического анализа и оценки минимальности решения. Модель верно определила оптимальное число…

13.12.2025

Читать →

Инструменты

[R3.2] MiniMax-M2 — логическая задача «Мини-Эйнштейн»

Тест R3.2 показывает, что MiniMax-M2 уверенно справляется с задачами на базовую дедукцию при чётко заданных и непротиворечивых условиях. В отличие от первой версии теста,…

13.12.2025

Читать →

Инструменты

[R3.1] MiniMax-M2 — задача Монти Холла (вероятностное reasoning)

Тест R3.1 показывает, что MiniMax-M2 уверенно справляется с базовыми вероятностными парадоксами и классическими логическими задачами. Даже при минималистичном формате ответа модель демонстрирует правильное понимание…

13.12.2025

Читать →

Инструменты

[C2.2] MiniMax-M2 — тест генерации Python-модуля Inventory

Поведение MiniMax-M2 под токенным давлением В ходе тестирования выявлено, что MiniMax-M2 чувствительно реагирует на размер выделенного max_tokens, особенно при задачах, где требуется длинный reasoning-блок.Это…

10.12.2025

Читать →

Инструменты

[C2.1] MiniMax-M2 — стабильность генерации Python-модуля UserStore

Тест C2.1 проверяет способность MiniMax-M2 стабильно генерировать небольшой Python-модуль без комментариев, объяснений и отклонений от задания.Модуль содержит класс UserStore с четырьмя методами: инициализация, добавление…

10.12.2025

Читать →

Инструменты

[C1.9] MiniMax-M2 — JavaScript-валидация email (поведение на регулярных выражениях)

Критичное наблюдение MiniMax-M2 требует существенно более высоких лимитов reasoning, чем ожидалось даже на простых задачах. На коротких потолках модель: переходит в глубокий reasoning-мод, начинает…

10.12.2025

Читать →

Инструменты

[R1.4] MiniMax-M2 — тест на обращение логических условий

В тесте R1.4 мы проверяем способность MiniMax-M2 работать с инверсией логических утверждений — типовая слабость многих моделей. Условия: Модель дала правильный ответ («no»), корректно…

08.12.2025

Читать →

Инструменты

[R1.3] MiniMax-M2 — тест логического силлогизма

В тесте R1.3 мы проверяем, как MiniMax-M2 справляется с базовым логическим силлогизмом в Anthropic-совместимом режиме (messages.create). Модели дали простую цепочку:«Все кошки — животные. Все…

08.12.2025

Читать →

Инструменты

[R1.2] MiniMax M2 — базовая арифметика (проверка простого сложения)

MiniMax M2 корректно выполнил базовую арифметическую задачу, дав краткий ответ и не раскрыв цепочку рассуждений в текстовом блоке. Модель строго соблюла инструкцию системного промпта…

08.12.2025

Читать →