MiniMax M2 тест простого силлогизма

[R1.3] MiniMax-M2 — тест логического силлогизма

Дополнительная информация

В тесте R1.3 мы проверяем, как MiniMax-M2 справляется с базовым логическим силлогизмом в Anthropic-совместимом режиме (messages.create).

Модели дали простую цепочку:
«Все кошки — животные. Все животные — смертны. Является ли каждая кошка смертной?»
Формат ответа был жёстко ограничен: только «yes» или «no».

MiniMax-M2 ответила правильно («yes»), но при этом снова раскрыла внутреннюю цепочку рассуждений в thinking-блоке, несмотря на прямой запрет в system-промпте. Это повторяет поведение, зафиксированное в предыдущих тестах серии R1.x и показывает системную особенность: логика у модели работает стабильно, но дисциплина по скрытию chain-of-thought нарушается.

Вывод по тесту: MiniMax-M2 уверенно решает элементарные логические задачи, однако при использовании Anthropic API нужно учитывать, что reasoning-блок всё равно будет возвращаться и его придётся фильтровать на уровне приложения.

Информация

ID теста: 805

Тип:

Статус:

Модель: Minimax M2

Экосистема: MiniMax

Дата теста: 08.12.2025 23:45

Все тесты