[R3.4] MiniMax-M2 — парадокс лжеца
Вывод по тесту R3.4 Тест показал, что MiniMax-M2 уверенно распознаёт самореферентные логические парадоксы и корректно работает с противоречиями в рамках классической логики. Модель не…
Читать →Вывод по тесту R3.4 Тест показал, что MiniMax-M2 уверенно распознаёт самореферентные логические парадоксы и корректно работает с противоречиями в рамках классической логики. Модель не…
13.12.2025
Читать →Тест «12 шаров» показал, что MiniMax-M2 корректно решает классические дедуктивные задачи, требующие многошагового логического анализа и оценки минимальности решения. Модель верно определила оптимальное число…
13.12.2025
Читать →Тест R3.2 показывает, что MiniMax-M2 уверенно справляется с задачами на базовую дедукцию при чётко заданных и непротиворечивых условиях. В отличие от первой версии теста,…
13.12.2025
Читать →Тест R3.1 показывает, что MiniMax-M2 уверенно справляется с базовыми вероятностными парадоксами и классическими логическими задачами. Даже при минималистичном формате ответа модель демонстрирует правильное понимание…
13.12.2025
Читать →Поведение MiniMax-M2 под токенным давлением В ходе тестирования выявлено, что MiniMax-M2 чувствительно реагирует на размер выделенного max_tokens, особенно при задачах, где требуется длинный reasoning-блок.Это…
10.12.2025
Читать →Тест C2.1 проверяет способность MiniMax-M2 стабильно генерировать небольшой Python-модуль без комментариев, объяснений и отклонений от задания.Модуль содержит класс UserStore с четырьмя методами: инициализация, добавление…
10.12.2025
Читать →Критичное наблюдение MiniMax-M2 требует существенно более высоких лимитов reasoning, чем ожидалось даже на простых задачах. На коротких потолках модель: переходит в глубокий reasoning-мод, начинает…
10.12.2025
Читать →В тесте R1.4 мы проверяем способность MiniMax-M2 работать с инверсией логических утверждений — типовая слабость многих моделей. Условия: Модель дала правильный ответ («no»), корректно…
08.12.2025
Читать →В тесте R1.3 мы проверяем, как MiniMax-M2 справляется с базовым логическим силлогизмом в Anthropic-совместимом режиме (messages.create). Модели дали простую цепочку:«Все кошки — животные. Все…
08.12.2025
Читать →MiniMax M2 корректно выполнил базовую арифметическую задачу, дав краткий ответ и не раскрыв цепочку рассуждений в текстовом блоке. Модель строго соблюла инструкцию системного промпта…
08.12.2025
Читать →