Архивы pass — Страница 4 из 5 — Re: II — Искусственный интеллект и стартапы

Статус: pass

Инструменты

[R3.4] MiniMax-M2 — парадокс лжеца

Вывод по тесту R3.4 Тест показал, что MiniMax-M2 уверенно распознаёт самореферентные логические парадоксы и корректно работает с противоречиями в рамках классической логики. Модель не…

13.12.2025

Читать →
Инструменты

[R3.3] MiniMax-M2 — логическая задача «12 шаров»

Тест «12 шаров» показал, что MiniMax-M2 корректно решает классические дедуктивные задачи, требующие многошагового логического анализа и оценки минимальности решения. Модель верно определила оптимальное число…

13.12.2025

Читать →
Инструменты

[R3.1] MiniMax-M2 — задача Монти Холла (вероятностное reasoning)

Тест R3.1 показывает, что MiniMax-M2 уверенно справляется с базовыми вероятностными парадоксами и классическими логическими задачами. Даже при минималистичном формате ответа модель демонстрирует правильное понимание…

13.12.2025

Читать →
Инструменты

[C2.2] MiniMax-M2 — тест генерации Python-модуля Inventory

Поведение MiniMax-M2 под токенным давлением В ходе тестирования выявлено, что MiniMax-M2 чувствительно реагирует на размер выделенного max_tokens, особенно при задачах, где требуется длинный reasoning-блок.Это…

10.12.2025

Читать →
Инструменты

[C2.1] MiniMax-M2 — стабильность генерации Python-модуля UserStore

Тест C2.1 проверяет способность MiniMax-M2 стабильно генерировать небольшой Python-модуль без комментариев, объяснений и отклонений от задания.Модуль содержит класс UserStore с четырьмя методами: инициализация, добавление…

10.12.2025

Читать →
Инструменты

[C1.9] MiniMax-M2 — JavaScript-валидация email (поведение на регулярных выражениях)

Критичное наблюдение MiniMax-M2 требует существенно более высоких лимитов reasoning, чем ожидалось даже на простых задачах. На коротких потолках модель: переходит в глубокий reasoning-мод, начинает…

10.12.2025

Читать →