На Wave Summit+ 2025 Baidu вывела на сцену обновлённую экосистему ERNIE и показала, какой должна быть корпоративная Large Language Model уровня enterprise. Но почти синхронно другие гиганты — Alibaba, Tencent, ByteDance и MiniMax — начали собственные релизы: новые версии Qwen3, мультимодальные модели, инструменты для агентов и RAG-сценариев. Неделя превратилась в компактную «битву экосистем», где каждая компания защищает свою долю внимания разработчиков и бизнеса. Разбираемся, что именно произошло и что это значит для пользователей в РФ и СНГ.
1. Что Baidu показала на Wave Summit+ 2025
Wave Summit+ 2025 — главный ежегодный форум Baidu для разработчиков, где компания обновляет свою линейку ERNIE и платформу PaddlePaddle. В этом году фокус сместился с простого «повышения IQ модели» к практической инженерии: снижению инференс-затрат, росту устойчивости reasoning и работе с реальными бизнес-процессами. Подробнее о самой модели можно посмотреть в карточке ERNIE в разделе China AI.
ERNIE X1.1 и ERNIE 4.5: ставка на reasoning и открытость
Главные герои саммита — новый reasoning-модельный стек ERNIE X1.1 и открытая линейка ERNIE 4.5. Если раньше ERNIE воспринимали как «ещё одну китайскую Нейронная сеть общего назначения», то теперь Baidu явно играет в долгую: они выводят на сцену отдельную линию моделей, заточенных под многошаговый reasoning, цепочки Chain-of-Thought и агентные сценарии.
ERNIE X1.1 позиционируется как модель, которая умеет:
- устойчиво вести длинные рассуждения без обрыва логики;
- меньше галлюцинировать на сложных инструкциях;
- работать в режиме Autonomous agent, когда LLM сама выбирает шаги и инструменты;
- поддерживать глубокий контекст для юридических, аналитических и инженерных задач.
Параллельно Baidu открывает веса и код одного из вариантов ERNIE 4.5 — это редкий жест для крупного китайского игрока. Фактически компания признаёт, что без открытой среды вокруг Mixture-of-Experts и продвинутых Transformer-архитектур удержать талантливых разработчиков будет невозможно.
Мультимодальный стек: «одна Мультимодальная модель вместо зоопарка сервисов»
Отдельный блок презентации посвящён мультимодальности. Baidu показывает развитие ERNIE как полноценной Мультимодальная модель: текст, изображения, таблицы, документы и в перспективе — видео. Идея проста: вместо зоопарка отдельных сервисов для OCR, CV и NLP компания предлагает единую модель, которая:
- читает сканы и PDF;
- описывает сцены на изображениях;
- анализирует слайды и отчёты;
- поддерживает интеграцию в RAG-пайплайны для корпоративных баз знаний.
Для enterprise-заказчика это означает, что одна Large Language Model может закрывать сразу несколько контуров: документооборот, поиск, аналитика, поддержка клиентов — без десятка отдельных API.
Промышленные кейсы: от завода до банка
Baidu подчёркивает не только бенчмарки, но и реальные истории внедрения. На сцену выводят кейсы производства, логистики, финансов и образования: от предиктивного обслуживания станков до интеллектуальных помощников для преподавателей, которые используют RAG и Векторная база данных для работы с учебными материалами.
Главный месседж: ERNIE — это больше не эксперимент для стартапов, а платформа, которую можно ставить в критичные бизнес-процессы.
Инструменты для партнёров и движение в сторону enterprise LLM
Параллельно Baidu обновляет PaddlePaddle: появляются улучшенные пайплайны для Mixture-of-Experts, оптимизация под 8-bit и 4-bit квантизация, а также инструменты для распределённого обучения. Для партнёров это значит, что они могут строить собственные доменные модели на базе ERNIE, не разворачивая с нуля весь стек обучения модели.
На уровне стратегии Baidu постепенно превращает ERNIE в китайский enterprise-стандарт: модель, которая живёт не в паблик-чатботе, а в закрытых контурах заводов, банков и гос-платформ. Это логичное продолжение курса на «Индустриальный Искусственный интеллект», где Large Language Model становится интерфейсом к данным, а не просто генератором текста.
2. Кто участвовал в Wave Summit: банки, гос-платформы и edtech
Формально WAVE Summit+ 2025 — конференция разработчиков, но реальный смысл события — демонстрация того, кто уже «внутри» экосистемы Baidu. На сцене и в кулуарах мелькают:
- банки и финтех-компании, которые строят ассистентов на базе ERNIE;
- госплатформы, интегрирующие LLM в сервисы «одного окна»;
- edtech-проекты, использующие ERNIE для персонализированного обучения;
- игроки промышленности, работающие с предиктивной аналитикой и цифровыми двойниками;
- разработчики, которые переходят с закрытых западных API на локальные китайские стек-сервисы.
Для Baidu это важный сигнал рынку: ERNIE — это уже не “ещё один чатбот”, а основа для симбиотического взаимодействия Multi-agent systems, где разные агенты обрабатывают документы, данные, запросы клиентов и команды операторов.
3. Параллельные релизы: конкуренты Baidu выбрали ту же неделю
Alibaba и Qwen3: ставка на масштаб и мультимодальность
Пока Baidu собирала журналистов и разработчиков на Wave Summit, Alibaba продолжала укреплять свою экосистему Qwen. В те же недели компания продвигает линейку Qwen3 и Qwen3-VL как флагманские модели для глобального рынка и собственного ассистента Qwen App. Здесь акцент — не на промышленном внедрении, а на гибкости и открытости.
Qwen3 позиционируется как семейство Large Language Model для задач от кода до диалогов, с поддержкой длинного контекста и улучшенного reasoning. Мультимодальная ветка Qwen3-VL работает как полноценная Vision-Language Model: она читает документы, анализирует сцены и подключается к RAG-пайплайнам.
Alibaba подчёркивает: Qwen — это открытый стек, который любой разработчик может скачать, квантизировать и запускать локально. Подробнее о самой линейке можно посмотреть в карточке модели Qwen. Для российского рынка это важный контрпункт: Qwen становится одним из ключевых источников open-source решений, когда западные LLM доступны с ограничениями.
Tencent и Hunyuan: экосистема вокруг медиа и 3D
Tencent выстраивает свою стратегию иначе. Линейка Hunyuan — это не только Large Language Model для текста, но и отдельные модели для изображений и 3D-контента. Последние обновления Hunyuan Image и связанных 3D-движков показывают: компания рассматривает ИИ как базовый слой для игр, контента и метавселенных.
Для Tencent ключевой рынок — креативные индустрии: игры, видео, интерактивные миры. Здесь Hunyuan выступает как мультимодальный двигатель, сплетая Diffusion-модель для картинок, генерацию видео и текстовую модель, которая управляет сценарием. Архитектурно это ближе к Agentic workflows, где LLM не просто генерирует текст, а дирижирует целым набором моделей.
Подробности по стеку можно дождать в карточке модели Hunyuan, куда логично будет сводить все ветки: текстовую, визуальную и 3D.
ByteDance и Doubao: ИИ как сердце контент- и рекламной машины
ByteDance развивает свою платформу Doubao как универсальный ИИ-слой для Douyin, рекламы и внутренних продуктов. Последние релизы включают специализированные модели для перевода и видео, которые работают поверх общей экосистемы Doubao и Volcengine. В отличие от Baidu и Alibaba, ByteDance меньше говорит о параметрах модели и больше — о прикладных сценариях.
Фокус компании — быстрый и дешёвый инференс для миллионов запросов в сутки: подбор подпиcей, субтитров, озвучка, переводы, адаптация роликов для разных рынков. С точки зрения архитектуры Doubao — это набор специализированных Нейронная сеть, а не один монолитный гигант.
Для Re-II логично выделить Doubao в отдельную карточку модели Doubao с упором на контент, рекламу и интеграцию в экосистему коротких видео.
MiniMax и ABAB/ MiniMax-01: стартап уровня AGI-платформы
На фоне гигантов особняком стоит MiniMax. Компания позиционирует себя как “AGI-native” платформу и развивает серию моделей ABAB и MiniMax-01: от текстовой Large Language Model до мультимодальных стэков для видео и аудио. При этом MiniMax делает ставку на массовое использование: их приложения уже обрабатывают миллиарды запросов в сутки.
Технически MiniMax интересна тем, что активно экспериментирует с Mixture-of-Experts, Distillation модели и различными режимами Speculative decoding, чтобы выжать максимум из доступных GPU. Это один из немногих игроков, кто балансирует между качеством reasoning и радикальным снижением стоимости инференса.
За MiniMax удобно следить через карточку модели MiniMax / ABAB, где можно собрать линейку: от текстовых моделей до мультимодальных Hailuo-сервисов.
4. Таблица: кто и что обновил в «неделю Wave Summit»
| Компания | Модель / стек | Ключевые улучшения | Где анонсировали | Мультимодальность | Основной фокус |
|---|---|---|---|---|---|
| Baidu | ERNIE X1.1, ERNIE 4.5 | Усиленный reasoning, снижение галлюцинаций, открытые веса | Wave Summit+ 2025 | Да, единая Мультимодальная модель | Enterprise LLM, промышленность, госуслуги |
| Alibaba | Qwen3 / Qwen3-VL | Увеличенный контекст, улучшенный reasoning, открытый код | Собственные анонсы Qwen | Да, Vision-Language Model | Глобальный open-source стек, ассистенты, e-commerce |
| Tencent | Hunyuan + Hunyuan Image / 3D | Усиление генерации изображений и 3D-контента | Отдельные релизы Tencent | Да, текст + изображение + 3D | Игры, медиа, креативные индустрии |
| ByteDance | Doubao стек | Модели перевода и видео, оптимизация стоимости инференса | Инфоканалы Volcengine / Doubao | Да, текст + видео + речь | Контент, реклама, Douyin-экосистема |
| MiniMax | ABAB / MiniMax-01 | Улучшенные MoE-модели, мультимодальные сервисы | Собственные релизы MiniMax | Да, текст + видео + аудио | AGI-платформа, массовые приложения |
5. Почему конкуренты релизят в те же даты?
Синхронность релизов — не совпадение. В китайском ИИ-ландшафте крупные игроки давно работают в режиме информационных волн: недели, когда один гигант собирает конференцию, автоматически становятся триггером для новостей остальных.
Есть несколько причин:
- Борьба за инфополе. Если Baidu доминирует в повестке из-за Wave Summit, молчать опасно — разработчики и корпорации могут решить, что именно ERNIE стал «дефолтом» для рынка.
- Эффект плеча. На волне интереса к ERNIE проще продвигать и Qwen, и Hunyuan, и Doubao — медиа уже следят за темой Искусственный интеллект, и любое обновление LLM легче попадает в новости.
- Внутренняя конкуренция за талант. Мощные релизы — способ показать инженерам и исследователям, что компания не отстаёт в гонке Large Language Model и Мультимодальная модель.
- Скорость рынка. Китайский ИИ-рынок работает в режиме Continual learning: экосистемы дообучаются и обновляются постоянно, а ключевые конференции становятся удобными «реперными точками» для выката новых версий.
В итоге Wave Summit+ 2025 — не монолог Baidu, а часть многоходовой «битвы экосистем», где каждая платформа — ERNIE, Qwen, Hunyuan, Doubao, MiniMax — пытается закрепиться как стандарт для своей ниши.
6. Что это значит для пользователей в России и СНГ
Для русскоязычного рынка эта китайская гонка выглядит далёкой, но на практике она даёт сразу несколько прямых эффектов.
Больше качественных open-source моделей
Чем агрессивнее Baidu и Alibaba открывают веса и коды, тем больше у разработчиков в СНГ рабочих альтернатив западным стек-сервисам. Qwen3, открытые варианты ERNIE 4.5 и модели MiniMax можно запускать локально, строить RAG-ассистентов поверх своих баз и использовать их как ядро для Symbiotic AI-сценариев.
Доступность без VPN и санкционных рисков
Китайские модели удобны тем, что многие из них распространяются через открытые репозитории без политического и санкционного налёта. Для компаний, которые не могут позволить себе прямую интеграцию с западными API, Qwen, ERNIE и MiniMax становятся реалистичной альтернативой.
Снижение стоимости инференса и рост конкуренции
Борьба за пользователей и разработчиков заставляет компании оптимизировать инфраструктуру: внедрять квантизацию, Token merging, Speculative decoding и другие техники ускорения. Для разработчика это означает одно: стоимость инференса падает, а качество ответов Large Language Model растёт.
Новые стеки reasoning и RAG
Китайские платформы активно экспериментируют с Chain-of-Thought, Tool use, Multi-agent systems и сложными RAG-контурами. На практике это превращается в готовые решения: от enterprise-ассистентов до кодовых агентов, которые можно адаптировать под локальные задачи.
7. Итог: Китайские LLM-экосистемы выходят на новый уровень
Wave Summit+ 2025 закрепляет Baidu как одного из лидеров enterprise LLM: ERNIE X1.1 и ERNIE 4.5 делают ставку на reasoning, устойчивость и промышленное применение. Но неделя не принадлежит только Baidu: Alibaba двигает вперёд Qwen3, Tencent развивает Hunyuan, ByteDance масштабирует Doubao, а MiniMax предлагает гибкую AGI-платформу с фокусом на мультимодальность.
Для рынка это значит, что в Китае сформировался полноценный «многоцентровый» мир Искусственный интеллект, где нет одного монополиста: несколько экосистем параллельно конкурируют по качеству, стоимости, открытости и удобству интеграции.
Для разработчиков и компаний в РФ и СНГ это открывает окно возможностей: можно выбирать LLM не по принципу «что вообще доступно», а по инженерным критериям — глубина reasoning, длина контекста, мультимодальность, стоимость инференса, поддержка RAG и качество инструментов для Prompt engineering.
Подробнее обо всех моделях — в разделе China AI и в отдельных карточках: Baidu ERNIE, Alibaba Qwen, Tencent Hunyuan, ByteDance Doubao, MiniMax / ABAB.