Тип теста: Reasoning / Логика

Инструменты

[R1.3] MiniMax-M2 — тест логического силлогизма

В тесте R1.3 мы проверяем, как MiniMax-M2 справляется с базовым логическим силлогизмом в Anthropic-совместимом режиме (messages.create). Модели дали простую цепочку:«Все кошки — животные. Все…

08.12.2025

Читать →

Инструменты

[R1.2] MiniMax M2 — базовая арифметика (проверка простого сложения)

MiniMax M2 корректно выполнил базовую арифметическую задачу, дав краткий ответ и не раскрыв цепочку рассуждений в текстовом блоке. Модель строго соблюла инструкцию системного промпта…

08.12.2025

Читать →

Инструменты

[R1.1] MiniMax-M2 — задача с коробками (Anthropic SDK, корректный вывод)

Что проверяли Тестируем MiniMax-M2 на классической логической задаче с тремя коробками («Шоколад», «Карамель», «Смешанные»), где все подписи заведомо неверные и нужно за один вытянутый…

08.12.2025

Читать →

Инструменты

[R1.0] MiniMax-M2 — классическая задача с коробками (Chat API, некорректный вывод)

Этот тест демонстрирует, что MiniMax-M2 некорректно работает через устаревший Chat Completions API.Несмотря на сильные reasoning-способности модели, интерфейс chat/completions заставляет её раскрывать внутренние рассуждения и…

08.12.2025

Читать →

Экосистемы

Тип теста: Reasoning / Логика

[R1.3] MiniMax-M2 — тест логического силлогизма

[R1.2] MiniMax M2 — базовая арифметика (проверка простого сложения)

[R1.1] MiniMax-M2 — задача с коробками (Anthropic SDK, корректный вывод)

[R1.0] MiniMax-M2 — классическая задача с коробками (Chat API, некорректный вывод)