Результаты тестов моделей искусственного интеллекта

Результаты тестов моделей

Тесты математики MiniMax M2: сильное мышление, слабый контроль исполнения

Протестировали MiniMax M2 на 25 математических задачах: от базовой арифметики до анализа, теории чисел и олимпиадных уравнений. Формальный pass-rate составил 76%, однако значительная часть «провалов» связана не с…

Подробнее →

Свежее

Telegram Ре: ИИ

Самое свежее про ИИ

Перейти

Результаты тестов моделей

Тесты reasoning MiniMax M2: модель думает правильно, но нарушает формат

Во втором этапе тестирования MiniMax M2 мы сфокусировались на reasoning-задачах и получили важный результат: модель почти не ошибается по смыслу, но регулярно нарушает формат…

14.12.2025

Читать →

Результаты тестов моделей

MiniMax M2: первые наблюдения из серии тестов модели

Мы начали серию системных тестов MiniMax M2 и сразу обнаружили характерные паттерны поведения: модель уверенно решает логические цепочки, но при увеличении токенов расширяет ответы,…

09.12.2025

Читать →

Экосистемы

Тесты математики MiniMax M2: сильное мышление, слабый контроль исполнения

Свежее

Telegram Ре: ИИ

Тесты reasoning MiniMax M2: модель думает правильно, но нарушает формат

MiniMax M2: первые наблюдения из серии тестов модели