GigaChat Ultra — флагманская модель линейки GigaChat от Сбера, представленная 24 марта 2026 года. Это полностью российская разработка: обучение проходило на отечественных вычислительных кластерах, архитектура и данные оптимизированы под русскоязычные сценарии. Модель построена на масштабируемой архитектуре Mixture-of-Experts (MoE) и позиционируется как прямой наследник GigaChat MAX, обеспечивая двукратный прирост скорости при значительном улучшении качества.
GigaChat Ultra — это не только ответ на глобальные англо-китайские LLM, но и технологическая основа для нового поколения AI-агентов в экосистеме Сбера. Модель уже интегрируется в пользовательские сервисы и корпоративные продукты и в перспективе станет базой для reasoning-линейки.
Архитектура и масштаб
Архитектура: Mixture-of-Experts (MoE), собственная разработка
Общее количество параметров: не раскрывается (оценочно выше 500B)
Активируемых параметров на токен: около 35–45B
Скорость генерации: до 120 токенов/с
Контекстное окно: до 256K токенов
Аппаратная платформа обучения: российские вычислительные кластеры
Разреженная MoE-архитектура позволяет достигать высокой производительности без активации всех экспертов одновременно. Это критично для эффективной работы на доступной вычислительной базе и масштабирования под реальные инфраструктурные ограничения.
Ключевые технологические особенности
Долгосрочная память и персонализация
В модели реализован механизм долгосрочной памяти. GigaChat Ultra сохраняет контекст взаимодействия и адаптирует ответы под пользователя — его стиль, задачи и предыдущие диалоги. Память может использоваться между сессиями без повторной передачи истории.
Мультиагентный режим
Модель способна выступать координатором группы специализированных ИИ-агентов. Она декомпозирует задачу на подзадачи, распределяет их между агентами (анализ, код, перевод, работа с документами) и агрегирует результат. Это позволяет автоматизировать сложные многошаговые процессы.
Глубокая русификация данных и инструкций
Модель обучена на сбалансированном русскоязычном корпусе с акцентом на деловую, юридическую и научную лексику. Дополнительное обучение на пользовательских сценариях улучшает понимание разговорной речи, профессионального сленга и официально-делового стиля.
Оптимизация под отечественное «железо»
GigaChat Ultra изначально проектировалась с учётом доступной вычислительной инфраструктуры. Оптимизация фреймворков обучения и инференса под локальные кластеры обеспечивает приемлемую стоимость эксплуатации и технологическую независимость.
Benchmark-показатели
По данным разработчиков, модель демонстрирует сильные результаты на русскоязычных бенчмарках:
MERA — лидер среди аналогов, опережение ближайших конкурентов на 9–11 п.п.
RuMATH — около 82% точности
Russian SuperGLUE — уровень лучших закрытых моделей
Агентные тесты — высокая стабильность в мультиагентных сценариях
В русскоязычных задачах модель показывает преимущество над DeepSeek V4, тогда как в универсальных задачах результаты сопоставимы.
Сценарии применения
Корпоративные AI-ассистенты
персональные помощники с долгосрочной памятью;
автоматизация документооборота;
интеллектуальный поиск по базам знаний.
Мультиагентные бизнес-решения
Модель может управлять набором специализированных агентов, обеспечивая комплексное выполнение задач — от клиентской поддержки до аналитики и юридических процессов.
Образование и наука
Эффективна как тьютор, инструмент рецензирования и генерации учебных материалов благодаря глубокому пониманию русского языка.
Госсектор
Используется в пилотных проектах для автоматизации обработки документов и обращений граждан.
Сравнение с китайскими моделями
В сравнении с DeepSeek V4 и другими азиатскими моделями, GigaChat Ultra демонстрирует выраженную специализацию.
Языковая специализация: модель значительно превосходит конкурентов в русскоязычных задачах, включая генерацию официальных документов и понимание контекста.
Аппаратная независимость: система ориентирована на локальную инфраструктуру, обеспечивая высокий уровень технологического суверенитета.
Агентность: оптимизирована под интеграцию с российскими сервисами и API.
Доступность: распространяется в рамках экосистемы Сбера, в отличие от open-weight моделей.
Таким образом, в сегменте русскоязычных бизнес-задач модель занимает лидирующие позиции, тогда как зарубежные аналоги выигрывают в универсальности.
Ограничения
Закрытость архитектуры и параметров;
Ограниченная эффективность вне русскоязычного контекста;
Вероятность галлюцинаций и логических ошибок;
Высокие требования к вычислительным ресурсам;
Ограниченная мультимодальность на старте.
Роль в экосистеме Сбера
GigaChat Ultra является центральной моделью стратегии Сбера в области ИИ. Она объединяет предыдущие наработки и становится базой для пользовательских сервисов, корпоративных решений и будущих моделей.
Модель выступает в роли единого интеллектуального ядра, обеспечивая переход к мультиагентной экосистеме, ориентированной на русскоязычные сценарии и локальный рынок.