Результаты тестов моделей искусственного интеллекта
Результаты тестов моделей

Тесты математики MiniMax M2: сильное мышление, слабый контроль исполнения

Протестировали MiniMax M2 на 25 математических задачах: от базовой арифметики до анализа, теории чисел и олимпиадных уравнений. Формальный pass-rate составил 76%, однако значительная часть «провалов» связана не с…

Подробнее →