Обновления Alibaba Qwen — Qwen2.5, Qwen3, Omni и Max
Обновления модели

Alibaba Qwen

Alibaba Qwen — семейство китайских языковых и мультимодальных моделей, разработанных Alibaba Cloud для задач текста, изображений, кода и корпоративных сценариев

Обновления
NeuroCat Updates

Как развивается Qwen: общая картина

Alibaba Qwen развивается не как «одна модель с апдейтами», а как постоянно расширяющееся семейство, где новые поколения, специализированные ветки и архитектурные эксперименты выходят параллельно. Темп релизов в 2024–2025 годах показывает, что Qwen — это долгосрочная модельная платформа Alibaba Cloud, а не разовая «витрина» для рынка. В публичной динамике видны три устойчивых тренда: быстрое обновление базовых LLM-линий, наращивание мультимодальности и регулярный выпуск прикладных специализированных моделей под код, изображение и real-time сценарии.

Ключевые релизы по годам

2024: укрепление базовой линейки и переход к Qwen2.5

В 2024 году Alibaba закрепила Qwen как платформу второго поколения. Летом была выпущена серия Qwen2 — она стала основой для масштабирования качества, контекста и многоязычия. Осенью вышла Qwen2.5, где семейство расширили дополнительными размерами и улучшили поведение в задачах рассуждений и кода. Это поколение стало мостом к более сложным архитектурам и вывело Qwen в число основных китайских платформ LLM.

Январь–март 2025: Qwen2.5-Max и усиление мультимодальности

В начале 2025 года Alibaba ускорила цикл обновлений. В конце января был представлен флагман Qwen2.5-Max — крупная модель с акцентом на максимальное качество в сложных текстовых и агентных сценариях. Параллельно компания начала агрессивно развивать мультимодальные ветки: в марте вышла Qwen2.5-VL-32B-Instruct как продолжение визуально-языковой линии, а следом — Qwen2.5-Omni-7B, первая доступная «omni»-модель, объединяющая текст, изображение, аудио и видео в одном стеке. Эти релизы показали, что Qwen движется к реальному времени и к продуктам, где модель должна работать сразу с несколькими типами данных.

Апрель 2025: запуск поколения Qwen3

В конце апреля Alibaba выпустила Qwen3 — поворотный релиз, который оформил новое поколение как самостоятельное семейство. ВQwen3 вышли как плотные модели разных размеров, так и MoE-версии с высокой параметрической ёмкостью при умеренной стоимости инференса. Подчёркнутыми особенностями поколения стали увеличение контекстных окон до уровня, пригодного для обработки длинных документов, и появление режимов рассуждения, которыми можно управлять на уровне токенизации и параметров вызова. Важно, что Qwen3 был опубликован с открытыми весами, что усилило позицию семейства в разработческом сообществе.

Лето 2025: специализированные модели для кода

Летом в экосистеме появились отдельные прикладные релизы Qwen3-Coder — специализированная линия под задачи программирования, генерации и анализа кода. Это типичное развитие зрело́й платформы: после обновления «ядра» выходит отдельный класс моделей, заточенных под конкретные отраслевые сценарии, прежде всего developer-инструменты и автоматизацию инженерных процессов.

Сентябрь–ноябрь 2025: Qwen3-Max, Qwen3-Next и Qwen3-Omni

Осень 2025 года стала самым насыщенным периодом. В сентябре Alibaba представила Qwen3-Max — тяжёлый флагман, рассчитанный на облачный инференс, агентные системы и высокую точность в сложных задачах. В тот же период была выпущена архитектурная ветка Qwen3-Next — экспериментальное семейство, где Alibaba тестирует гибридное внимание, более разреженные MoE-структуры и ускоренное предсказание токенов. Это направление важно как задел под следующее поколение: публично заявлено, что будущие версии (условно Qwen3.5) будут развиваться из этой архитектуры.

Ещё один ключевой релиз сентября — Qwen3-Omni, omni-модель нового поколения. Она развивает идею мультимодальности в сторону нативного «сквозного» стека: модель способна работать с текстом, изображениями, аудио и видео в единой логике, а также выдавать ответы в режиме потокового текста и речи. К этому же блоку относится Qwen3-LiveTranslate — прикладная мультимодальная версия для синхронного перевода в реальном времени. В ноябре 2025 года для Qwen3-Max публично открыли «thinking»-режим, то есть глубинное рассуждение стало доступно широкому кругу пользователей.

Что важно отслеживать дальше

Дальнейшее развитие Qwen, судя по публичной траектории, будет идти по трём линиям. Первая — усиление архитектуры Next и перенос её в массовое поколение. Вторая — рост мультимодальной «omni»-ветки и её закрепление в real-time продуктах (голос, видео, устройства). Третья — расширение специализированных моделей под отрасли: код, визуальная аналитика, корпоративные агенты. Для разработчиков и бизнеса главный практический вывод простой: Qwen уже стал платформой, где почти под любую задачу есть подходящая модель-ветка, и каждое новое обновление расширяет, а не заменяет эту экосистему.

Последние обновления и новости