Результаты тестов моделей
Тесты reasoning MiniMax M2: модель думает правильно, но нарушает формат
Во втором этапе тестирования MiniMax M2 мы сфокусировались на reasoning-задачах и получили важный результат: модель почти не ошибается по смыслу, но регулярно нарушает формат…
Читать →