MiniMax начала закрытое тестирование версии ABAB-6.1, ориентированной на агентные сценарии и сложные многошаговые пайплайны. В отличие от ABAB-6.0, фокус нового релиза смещён с диалоговой логики на автономное выполнение задач: планирование, разбиение больших процессов, управление инструментами и последовательное принятие решений.
По данным MiniMax, модель демонстрирует заметный рост в сценариях, где требуется не просто сгенерировать ответ, а сформировать стратегию действий. Это делает ABAB-6.1 одной из первых китайских моделей, которые системно оптимизируются под agent-first архитектуру.
Что нового в ABAB-6.1
Усиленный модуль планирования
ABAB-6.1 научилась надёжно строить многошаговые планы и корректировать их в процессе выполнения. В отличие от предыдущей версии, модель удерживает цель, не «съезжая» на побочные ветки, что критично для агентных пайплайнов.
Более корректный tool-use
Новый механизм делает использование инструментов более предсказуемым:
модель лучше понимает формат входных данных, правильно формирует вызовы и умеет возвращаться к предыдущим шагам, если инструмент дал неожиданный результат.
Сложные рабочие процессы
ABAB-6.1 проходит тестирование на:
- управлении несколькими источниками данных;
- обработке файлов + кодогенерации внутри одной сессии;
- тестах, где требуется переключение между задачами;
- сценариях «цель → подзадачи → инструменты → проверка результата».
По сути, MiniMax обучает модель работать как автономный исполнитель, а не как чат-ассистент.
Сильная сторона — долгие reasoning-цепочки
ABAB-6.1 удерживает логическую линию на множестве шагов без дробления ответа. Для агентных систем это ключевой показатель — модель должна понимать, почему она делает каждый шаг, и как он связан с итоговой целью.
Почему это важно
Рынок агентных систем входит в фазу, где ключевым становится не размер модели, а её способность:
- формировать грамотный план действий,
- работать с реальными инструментами,
- исправлять свои ошибки,
- поддерживать контекст задач десятками шагов.
ABAB-6.1 — первая модель MiniMax, которая развивается именно в этом направлении: не как диалоговый интеллект, а как операционный исполнитель, который способен брать на себя часть функций обычного ПО.
Это усиливает позиции MiniMax на фоне конкурентов, которые всё ещё находятся в переходной стадии между чат-LLM и полноценными AI-агентами.