Китайская битва LLM: ERNIE, Qwen, Hunyuan, Doubao, MiniMax

Китайская битва LLM: Baidu ERNIE против Qwen, Hunyuan, Doubao и MiniMax

~2 мин чтения

На Wave Summit+ 2025 Baidu вывела на сцену обновлённую экосистему ERNIE и показала, какой должна быть корпоративная Large Language Model уровня enterprise. Но почти синхронно другие гиганты — Alibaba, Tencent, ByteDance и MiniMax — начали собственные релизы: новые версии Qwen3, мультимодальные модели, инструменты для агентов и RAG-сценариев. Неделя превратилась в компактную «битву экосистем», где каждая компания защищает свою долю внимания разработчиков и бизнеса. Разбираемся, что именно произошло и что это значит для пользователей в РФ и СНГ.


1. Что Baidu показала на Wave Summit+ 2025

Wave Summit+ 2025 — главный ежегодный форум Baidu для разработчиков, где компания обновляет свою линейку ERNIE и платформу PaddlePaddle. В этом году фокус сместился с простого «повышения IQ модели» к практической инженерии: снижению инференс-затрат, росту устойчивости reasoning и работе с реальными бизнес-процессами. Подробнее о самой модели можно посмотреть в карточке ERNIE в разделе China AI.

ERNIE X1.1 и ERNIE 4.5: ставка на reasoning и открытость

Главные герои саммита — новый reasoning-модельный стек ERNIE X1.1 и открытая линейка ERNIE 4.5. Если раньше ERNIE воспринимали как «ещё одну китайскую Нейронная сеть общего назначения», то теперь Baidu явно играет в долгую: они выводят на сцену отдельную линию моделей, заточенных под многошаговый reasoning, цепочки Chain-of-Thought и агентные сценарии.

ERNIE X1.1 позиционируется как модель, которая умеет:

  • устойчиво вести длинные рассуждения без обрыва логики;
  • меньше галлюцинировать на сложных инструкциях;
  • работать в режиме Autonomous agent, когда LLM сама выбирает шаги и инструменты;
  • поддерживать глубокий контекст для юридических, аналитических и инженерных задач.

Параллельно Baidu открывает веса и код одного из вариантов ERNIE 4.5 — это редкий жест для крупного китайского игрока. Фактически компания признаёт, что без открытой среды вокруг Mixture-of-Experts и продвинутых Transformer-архитектур удержать талантливых разработчиков будет невозможно.

Мультимодальный стек: «одна Мультимодальная модель вместо зоопарка сервисов»

Отдельный блок презентации посвящён мультимодальности. Baidu показывает развитие ERNIE как полноценной Мультимодальная модель: текст, изображения, таблицы, документы и в перспективе — видео. Идея проста: вместо зоопарка отдельных сервисов для OCR, CV и NLP компания предлагает единую модель, которая:

  • читает сканы и PDF;
  • описывает сцены на изображениях;
  • анализирует слайды и отчёты;
  • поддерживает интеграцию в RAG-пайплайны для корпоративных баз знаний.

Для enterprise-заказчика это означает, что одна Large Language Model может закрывать сразу несколько контуров: документооборот, поиск, аналитика, поддержка клиентов — без десятка отдельных API.

Промышленные кейсы: от завода до банка

Baidu подчёркивает не только бенчмарки, но и реальные истории внедрения. На сцену выводят кейсы производства, логистики, финансов и образования: от предиктивного обслуживания станков до интеллектуальных помощников для преподавателей, которые используют RAG и Векторная база данных для работы с учебными материалами.

Главный месседж: ERNIE — это больше не эксперимент для стартапов, а платформа, которую можно ставить в критичные бизнес-процессы.

Инструменты для партнёров и движение в сторону enterprise LLM

Параллельно Baidu обновляет PaddlePaddle: появляются улучшенные пайплайны для Mixture-of-Experts, оптимизация под 8-bit и 4-bit квантизация, а также инструменты для распределённого обучения. Для партнёров это значит, что они могут строить собственные доменные модели на базе ERNIE, не разворачивая с нуля весь стек обучения модели.

На уровне стратегии Baidu постепенно превращает ERNIE в китайский enterprise-стандарт: модель, которая живёт не в паблик-чатботе, а в закрытых контурах заводов, банков и гос-платформ. Это логичное продолжение курса на «Индустриальный Искусственный интеллект», где Large Language Model становится интерфейсом к данным, а не просто генератором текста.


2. Кто участвовал в Wave Summit: банки, гос-платформы и edtech

Формально WAVE Summit+ 2025 — конференция разработчиков, но реальный смысл события — демонстрация того, кто уже «внутри» экосистемы Baidu. На сцене и в кулуарах мелькают:

  • банки и финтех-компании, которые строят ассистентов на базе ERNIE;
  • госплатформы, интегрирующие LLM в сервисы «одного окна»;
  • edtech-проекты, использующие ERNIE для персонализированного обучения;
  • игроки промышленности, работающие с предиктивной аналитикой и цифровыми двойниками;
  • разработчики, которые переходят с закрытых западных API на локальные китайские стек-сервисы.

Для Baidu это важный сигнал рынку: ERNIE — это уже не “ещё один чатбот”, а основа для симбиотического взаимодействия Multi-agent systems, где разные агенты обрабатывают документы, данные, запросы клиентов и команды операторов.


3. Параллельные релизы: конкуренты Baidu выбрали ту же неделю

Alibaba и Qwen3: ставка на масштаб и мультимодальность

Пока Baidu собирала журналистов и разработчиков на Wave Summit, Alibaba продолжала укреплять свою экосистему Qwen. В те же недели компания продвигает линейку Qwen3 и Qwen3-VL как флагманские модели для глобального рынка и собственного ассистента Qwen App. Здесь акцент — не на промышленном внедрении, а на гибкости и открытости.

Qwen3 позиционируется как семейство Large Language Model для задач от кода до диалогов, с поддержкой длинного контекста и улучшенного reasoning. Мультимодальная ветка Qwen3-VL работает как полноценная Vision-Language Model: она читает документы, анализирует сцены и подключается к RAG-пайплайнам.

Alibaba подчёркивает: Qwen — это открытый стек, который любой разработчик может скачать, квантизировать и запускать локально. Подробнее о самой линейке можно посмотреть в карточке модели Qwen. Для российского рынка это важный контрпункт: Qwen становится одним из ключевых источников open-source решений, когда западные LLM доступны с ограничениями.

Tencent и Hunyuan: экосистема вокруг медиа и 3D

Tencent выстраивает свою стратегию иначе. Линейка Hunyuan — это не только Large Language Model для текста, но и отдельные модели для изображений и 3D-контента. Последние обновления Hunyuan Image и связанных 3D-движков показывают: компания рассматривает ИИ как базовый слой для игр, контента и метавселенных.

Для Tencent ключевой рынок — креативные индустрии: игры, видео, интерактивные миры. Здесь Hunyuan выступает как мультимодальный двигатель, сплетая Diffusion-модель для картинок, генерацию видео и текстовую модель, которая управляет сценарием. Архитектурно это ближе к Agentic workflows, где LLM не просто генерирует текст, а дирижирует целым набором моделей.

Подробности по стеку можно дождать в карточке модели Hunyuan, куда логично будет сводить все ветки: текстовую, визуальную и 3D.

ByteDance и Doubao: ИИ как сердце контент- и рекламной машины

ByteDance развивает свою платформу Doubao как универсальный ИИ-слой для Douyin, рекламы и внутренних продуктов. Последние релизы включают специализированные модели для перевода и видео, которые работают поверх общей экосистемы Doubao и Volcengine. В отличие от Baidu и Alibaba, ByteDance меньше говорит о параметрах модели и больше — о прикладных сценариях.

Фокус компании — быстрый и дешёвый инференс для миллионов запросов в сутки: подбор подпиcей, субтитров, озвучка, переводы, адаптация роликов для разных рынков. С точки зрения архитектуры Doubao — это набор специализированных Нейронная сеть, а не один монолитный гигант.

Для Re-II логично выделить Doubao в отдельную карточку модели Doubao с упором на контент, рекламу и интеграцию в экосистему коротких видео.

MiniMax и ABAB/ MiniMax-01: стартап уровня AGI-платформы

На фоне гигантов особняком стоит MiniMax. Компания позиционирует себя как “AGI-native” платформу и развивает серию моделей ABAB и MiniMax-01: от текстовой Large Language Model до мультимодальных стэков для видео и аудио. При этом MiniMax делает ставку на массовое использование: их приложения уже обрабатывают миллиарды запросов в сутки.

Технически MiniMax интересна тем, что активно экспериментирует с Mixture-of-Experts, Distillation модели и различными режимами Speculative decoding, чтобы выжать максимум из доступных GPU. Это один из немногих игроков, кто балансирует между качеством reasoning и радикальным снижением стоимости инференса.

За MiniMax удобно следить через карточку модели MiniMax / ABAB, где можно собрать линейку: от текстовых моделей до мультимодальных Hailuo-сервисов.


4. Таблица: кто и что обновил в «неделю Wave Summit»

КомпанияМодель / стекКлючевые улучшенияГде анонсировалиМультимодальностьОсновной фокус
BaiduERNIE X1.1, ERNIE 4.5Усиленный reasoning, снижение галлюцинаций, открытые весаWave Summit+ 2025Да, единая Мультимодальная модельEnterprise LLM, промышленность, госуслуги
AlibabaQwen3 / Qwen3-VLУвеличенный контекст, улучшенный reasoning, открытый кодСобственные анонсы QwenДа, Vision-Language ModelГлобальный open-source стек, ассистенты, e-commerce
TencentHunyuan + Hunyuan Image / 3DУсиление генерации изображений и 3D-контентаОтдельные релизы TencentДа, текст + изображение + 3DИгры, медиа, креативные индустрии
ByteDanceDoubao стекМодели перевода и видео, оптимизация стоимости инференсаИнфоканалы Volcengine / DoubaoДа, текст + видео + речьКонтент, реклама, Douyin-экосистема
MiniMaxABAB / MiniMax-01Улучшенные MoE-модели, мультимодальные сервисыСобственные релизы MiniMaxДа, текст + видео + аудиоAGI-платформа, массовые приложения

5. Почему конкуренты релизят в те же даты?

Синхронность релизов — не совпадение. В китайском ИИ-ландшафте крупные игроки давно работают в режиме информационных волн: недели, когда один гигант собирает конференцию, автоматически становятся триггером для новостей остальных.

Есть несколько причин:

  • Борьба за инфополе. Если Baidu доминирует в повестке из-за Wave Summit, молчать опасно — разработчики и корпорации могут решить, что именно ERNIE стал «дефолтом» для рынка.
  • Эффект плеча. На волне интереса к ERNIE проще продвигать и Qwen, и Hunyuan, и Doubao — медиа уже следят за темой Искусственный интеллект, и любое обновление LLM легче попадает в новости.
  • Внутренняя конкуренция за талант. Мощные релизы — способ показать инженерам и исследователям, что компания не отстаёт в гонке Large Language Model и Мультимодальная модель.
  • Скорость рынка. Китайский ИИ-рынок работает в режиме Continual learning: экосистемы дообучаются и обновляются постоянно, а ключевые конференции становятся удобными «реперными точками» для выката новых версий.

В итоге Wave Summit+ 2025 — не монолог Baidu, а часть многоходовой «битвы экосистем», где каждая платформа — ERNIE, Qwen, Hunyuan, Doubao, MiniMax — пытается закрепиться как стандарт для своей ниши.


6. Что это значит для пользователей в России и СНГ

Для русскоязычного рынка эта китайская гонка выглядит далёкой, но на практике она даёт сразу несколько прямых эффектов.

Больше качественных open-source моделей

Чем агрессивнее Baidu и Alibaba открывают веса и коды, тем больше у разработчиков в СНГ рабочих альтернатив западным стек-сервисам. Qwen3, открытые варианты ERNIE 4.5 и модели MiniMax можно запускать локально, строить RAG-ассистентов поверх своих баз и использовать их как ядро для Symbiotic AI-сценариев.

Доступность без VPN и санкционных рисков

Китайские модели удобны тем, что многие из них распространяются через открытые репозитории без политического и санкционного налёта. Для компаний, которые не могут позволить себе прямую интеграцию с западными API, Qwen, ERNIE и MiniMax становятся реалистичной альтернативой.

Снижение стоимости инференса и рост конкуренции

Борьба за пользователей и разработчиков заставляет компании оптимизировать инфраструктуру: внедрять квантизацию, Token merging, Speculative decoding и другие техники ускорения. Для разработчика это означает одно: стоимость инференса падает, а качество ответов Large Language Model растёт.

Новые стеки reasoning и RAG

Китайские платформы активно экспериментируют с Chain-of-Thought, Tool use, Multi-agent systems и сложными RAG-контурами. На практике это превращается в готовые решения: от enterprise-ассистентов до кодовых агентов, которые можно адаптировать под локальные задачи.


7. Итог: Китайские LLM-экосистемы выходят на новый уровень

Wave Summit+ 2025 закрепляет Baidu как одного из лидеров enterprise LLM: ERNIE X1.1 и ERNIE 4.5 делают ставку на reasoning, устойчивость и промышленное применение. Но неделя не принадлежит только Baidu: Alibaba двигает вперёд Qwen3, Tencent развивает Hunyuan, ByteDance масштабирует Doubao, а MiniMax предлагает гибкую AGI-платформу с фокусом на мультимодальность.

Для рынка это значит, что в Китае сформировался полноценный «многоцентровый» мир Искусственный интеллект, где нет одного монополиста: несколько экосистем параллельно конкурируют по качеству, стоимости, открытости и удобству интеграции.

Для разработчиков и компаний в РФ и СНГ это открывает окно возможностей: можно выбирать LLM не по принципу «что вообще доступно», а по инженерным критериям — глубина reasoning, длина контекста, мультимодальность, стоимость инференса, поддержка RAG и качество инструментов для Prompt engineering.

Подробнее обо всех моделях — в разделе China AI и в отдельных карточках: Baidu ERNIE, Alibaba Qwen, Tencent Hunyuan, ByteDance Doubao, MiniMax / ABAB.

QR Telegram

Подписывайтесь на наш Telegram

Новости, сводки и разборы

Читайте также