DeepSeek выпускает обновлённые модели V3.2 Speciale

DeepSeek представила V3.2 и V3.2-Speciale

~1 мин чтения

DeepSeek выпустила крупное обновление — модели V3.2 и V3.2-Speciale. Это новое поколение открытых LLM, ориентированных на длинные цепочки рассуждений, высокую скорость инференса и минимальное потребление ресурсов. По заявлению разработчиков, новые версии достигают качества, сравнимого с топовыми системами уровня GPT-5, оставаясь полностью открытыми и доступными для автономного развёртывания.

Что нового в DeepSeek V3.2

Обновлённая архитектура делает модель стабильнее в задачах с длинным контекстом и многошаговыми инструкциями. Переработаны механизмы self-attention, что улучшает понимание сложных логических структур и снижает вероятность ошибок при переходах между частями текста.

  • поддержка длинного контекста для анализа больших документов;
  • оптимизированный Sparse Attention, ускоряющий обработку данных;
  • улучшенная устойчивость reasoning-цепочек на сложных задачах;
  • повышенная точность при обработке математики, логики и программирования;
  • снижение нагрузки на память при работе с длинными инструкциями.

Модель показывает высокую устойчивость на задачах, требующих глубокого анализа, а оптимизация латентного пространства позволила улучшить качество вывода без роста размера сети.

Версия V3.2-Speciale

Специальная модификация V3.2-Speciale усиливает блоки рассуждений и снижает количество ошибок при работе со сложными многоступенчатыми запросами. Она ориентирована на корпоративные сценарии, где критична предсказуемость поведения модели и минимальный уровень галлюцинаций.

Внутренние тесты показывают улучшения в:

  • длинных рассуждениях с несколькими независимыми ветвями;
  • аналитических задачах с высоким числом факторов;
  • кодогенерации и математических доказательствах;
  • задачах, требующих последовательного планирования.

Почему обновление важно для рынка

DeepSeek показывает, что современные модели frontier-класса могут быть не только мощными, но и доступными. Благодаря открытому коду и высокой эффективности инференса V3.2 снижает барьер входа для исследователей, стартапов и компаний, которые не могут использовать дорогие закрытые продукты.

Сочетание long-context, улучшенного reasoning, оптимизированного KV-cache и открытой лицензии делает DeepSeek серьёзным конкурентом для крупных закрытых моделей. Релиз может привести к волне кастомизаций, внедрений в RAG-системы и появлению специализированных AI-агентов.

QR Telegram

Подписывайтесь на наш Telegram

Новости, сводки и разборы

Читайте также