Сбербанк объявил об открытии весов двух ключевых российских моделей — GigaChat и Kandinsky 5.0. Это самое масштабное открытие за весь период развития отечественного искусственного интеллекта. Теперь компании и разработчики могут работать с моделями напрямую, дообучать их под свои задачи и использовать в полностью автономных контурах.
Что именно открыл Сбер
В открытый доступ попали несколько вариантов GigaChat — языковых Large Language Model, построенных на архитектуре Transformer, с поддержкой длинных контекстов, токен-лимитов нового поколения и улучшенных attention head-механизмов. Внутри — обновлённая схема self-attention, контекстные эмбеддинги и оптимизированная loss-function.
Также опубликована визуальная Kandinsky 5.0 — diffusion-модель c продвинутым encoder-decoder-стеком. Она генерирует изображения и короткие видео, использует расширенное латентное пространство, поддерживает speculative decoding и работает быстрее предыдущих версий на GPU-кластерах и NPU-модулях.
Зачем это бизнесу
Компании могут обучать модели под собственный стиль — от внутренних инструкций до узкопрофильных терминов, используя partial fine-tuning и LoRA-слои. Это снижает риск hallucination моделей в сложных доменных сценариях и увеличивает точность reasoning-выводов.
Модели также рассчитаны на интеграцию в RAG-системы с векторными базами данных вроде FAISS, Milvus и Chroma DB. Это упрощает создание корпоративных ассистентов, аналитических агентов и систем AI Agent-класса.
Почему это важно для экосистемы
Публикация весов делает российский ИИ более независимым: разработчики могут развернуть inference в собственном контуре, обеспечить privacy-by-design и отказаться от внешних API-поставщиков. Кроме того, открытые чекпоинты ускорят исследования в области deep learning, distillation модели и multi-agent systems.
Что будет дальше
Сбер анонсировал планы по выпуску SDK, новых инструментов prompt engineering, моделей для speech-to-text, text-to-speech и моделей с длительной памятью (model memory). В 2026 ожидаются первые корпоративные сборки GigaChat с поддержкой continual learning.