GigaChat Ultra — обзор флагманской модели Сбера 2026
Модель ИИ

GigaChat Ultra

GigaChat Ultra
NeuroCat & GigaChat Ultra

GigaChat Ultra — флагманская модель линейки GigaChat от Сбера, представленная 24 марта 2026 года. Это полностью российская разработка: обучение проходило на отечественных вычислительных кластерах, архитектура и данные оптимизированы под русскоязычные сценарии. Модель построена на масштабируемой архитектуре Mixture-of-Experts (MoE) и позиционируется как прямой наследник GigaChat MAX, обеспечивая двукратный прирост скорости при значительном улучшении качества.

GigaChat Ultra — это не только ответ на глобальные англо-китайские LLM, но и технологическая основа для нового поколения AI-агентов в экосистеме Сбера. Модель уже интегрируется в пользовательские сервисы и корпоративные продукты и в перспективе станет базой для reasoning-линейки.

Архитектура и масштаб

Архитектура: Mixture-of-Experts (MoE), собственная разработка
Общее количество параметров: не раскрывается (оценочно выше 500B)
Активируемых параметров на токен: около 35–45B
Скорость генерации: до 120 токенов/с
Контекстное окно: до 256K токенов
Аппаратная платформа обучения: российские вычислительные кластеры

Разреженная MoE-архитектура позволяет достигать высокой производительности без активации всех экспертов одновременно. Это критично для эффективной работы на доступной вычислительной базе и масштабирования под реальные инфраструктурные ограничения.

Ключевые технологические особенности

Долгосрочная память и персонализация

В модели реализован механизм долгосрочной памяти. GigaChat Ultra сохраняет контекст взаимодействия и адаптирует ответы под пользователя — его стиль, задачи и предыдущие диалоги. Память может использоваться между сессиями без повторной передачи истории.

Мультиагентный режим

Модель способна выступать координатором группы специализированных ИИ-агентов. Она декомпозирует задачу на подзадачи, распределяет их между агентами (анализ, код, перевод, работа с документами) и агрегирует результат. Это позволяет автоматизировать сложные многошаговые процессы.

Глубокая русификация данных и инструкций

Модель обучена на сбалансированном русскоязычном корпусе с акцентом на деловую, юридическую и научную лексику. Дополнительное обучение на пользовательских сценариях улучшает понимание разговорной речи, профессионального сленга и официально-делового стиля.

Оптимизация под отечественное «железо»

GigaChat Ultra изначально проектировалась с учётом доступной вычислительной инфраструктуры. Оптимизация фреймворков обучения и инференса под локальные кластеры обеспечивает приемлемую стоимость эксплуатации и технологическую независимость.

Benchmark-показатели

По данным разработчиков, модель демонстрирует сильные результаты на русскоязычных бенчмарках:

MERA — лидер среди аналогов, опережение ближайших конкурентов на 9–11 п.п.
RuMATH — около 82% точности
Russian SuperGLUE — уровень лучших закрытых моделей
Агентные тесты — высокая стабильность в мультиагентных сценариях

В русскоязычных задачах модель показывает преимущество над DeepSeek V4, тогда как в универсальных задачах результаты сопоставимы.

Сценарии применения

Корпоративные AI-ассистенты

персональные помощники с долгосрочной памятью;
автоматизация документооборота;
интеллектуальный поиск по базам знаний.

Мультиагентные бизнес-решения

Модель может управлять набором специализированных агентов, обеспечивая комплексное выполнение задач — от клиентской поддержки до аналитики и юридических процессов.

Образование и наука

Эффективна как тьютор, инструмент рецензирования и генерации учебных материалов благодаря глубокому пониманию русского языка.

Госсектор

Используется в пилотных проектах для автоматизации обработки документов и обращений граждан.

Сравнение с китайскими моделями

В сравнении с DeepSeek V4 и другими азиатскими моделями, GigaChat Ultra демонстрирует выраженную специализацию.

Языковая специализация: модель значительно превосходит конкурентов в русскоязычных задачах, включая генерацию официальных документов и понимание контекста.

Аппаратная независимость: система ориентирована на локальную инфраструктуру, обеспечивая высокий уровень технологического суверенитета.

Агентность: оптимизирована под интеграцию с российскими сервисами и API.

Доступность: распространяется в рамках экосистемы Сбера, в отличие от open-weight моделей.

Таким образом, в сегменте русскоязычных бизнес-задач модель занимает лидирующие позиции, тогда как зарубежные аналоги выигрывают в универсальности.

Ограничения

Закрытость архитектуры и параметров;
Ограниченная эффективность вне русскоязычного контекста;
Вероятность галлюцинаций и логических ошибок;
Высокие требования к вычислительным ресурсам;
Ограниченная мультимодальность на старте.

Роль в экосистеме Сбера

GigaChat Ultra является центральной моделью стратегии Сбера в области ИИ. Она объединяет предыдущие наработки и становится базой для пользовательских сервисов, корпоративных решений и будущих моделей.

Модель выступает в роли единого интеллектуального ядра, обеспечивая переход к мультиагентной экосистеме, ориентированной на русскоязычные сценарии и локальный рынок.