[R1.3] MiniMax-M2 — тест логического силлогизма
В тесте R1.3 мы проверяем, как MiniMax-M2 справляется с базовым логическим силлогизмом в Anthropic-совместимом режиме (messages.create). Модели дали простую цепочку:«Все кошки — животные. Все…
Читать →В тесте R1.3 мы проверяем, как MiniMax-M2 справляется с базовым логическим силлогизмом в Anthropic-совместимом режиме (messages.create). Модели дали простую цепочку:«Все кошки — животные. Все…
08.12.2025
Читать →MiniMax M2 корректно выполнил базовую арифметическую задачу, дав краткий ответ и не раскрыв цепочку рассуждений в текстовом блоке. Модель строго соблюла инструкцию системного промпта…
08.12.2025
Читать →Что проверяли Тестируем MiniMax-M2 на классической логической задаче с тремя коробками («Шоколад», «Карамель», «Смешанные»), где все подписи заведомо неверные и нужно за один вытянутый…
08.12.2025
Читать →Этот тест демонстрирует, что MiniMax-M2 некорректно работает через устаревший Chat Completions API.Несмотря на сильные reasoning-способности модели, интерфейс chat/completions заставляет её раскрывать внутренние рассуждения и…
08.12.2025
Читать →