Сбер открыл веса GigaChat и Kandinsky 5.0

Сбер открыл веса GigaChat и Kandinsky 5.0 — российские нейросети выходят на новый уровень

~1 мин чтения

Сбербанк объявил об открытии весов двух ключевых российских моделей — GigaChat и Kandinsky 5.0. Это самое масштабное открытие за весь период развития отечественного искусственного интеллекта. Теперь компании и разработчики могут работать с моделями напрямую, дообучать их под свои задачи и использовать в полностью автономных контурах.

Что именно открыл Сбер

В открытый доступ попали несколько вариантов GigaChat — языковых Large Language Model, построенных на архитектуре Transformer, с поддержкой длинных контекстов, токен-лимитов нового поколения и улучшенных attention head-механизмов. Внутри — обновлённая схема self-attention, контекстные эмбеддинги и оптимизированная loss-function.

Также опубликована визуальная Kandinsky 5.0 — diffusion-модель c продвинутым encoder-decoder-стеком. Она генерирует изображения и короткие видео, использует расширенное латентное пространство, поддерживает speculative decoding и работает быстрее предыдущих версий на GPU-кластерах и NPU-модулях.

Зачем это бизнесу

Компании могут обучать модели под собственный стиль — от внутренних инструкций до узкопрофильных терминов, используя partial fine-tuning и LoRA-слои. Это снижает риск hallucination моделей в сложных доменных сценариях и увеличивает точность reasoning-выводов.

Модели также рассчитаны на интеграцию в RAG-системы с векторными базами данных вроде FAISS, Milvus и Chroma DB. Это упрощает создание корпоративных ассистентов, аналитических агентов и систем AI Agent-класса.

Почему это важно для экосистемы

Публикация весов делает российский ИИ более независимым: разработчики могут развернуть inference в собственном контуре, обеспечить privacy-by-design и отказаться от внешних API-поставщиков. Кроме того, открытые чекпоинты ускорят исследования в области deep learning, distillation модели и multi-agent systems.

Что будет дальше

Сбер анонсировал планы по выпуску SDK, новых инструментов prompt engineering, моделей для speech-to-text, text-to-speech и моделей с длительной памятью (model memory). В 2026 ожидаются первые корпоративные сборки GigaChat с поддержкой continual learning.

QR Telegram

Подписывайтесь на наш Telegram

Новости, сводки и разборы

Читайте также