AI200 и AI250 — новые ускорители инференса

Qualcomm представила AI200 и AI250 — новые ускорители инференса

~1 мин чтения

Qualcomm представила новые ускорители инференса для искусственного интеллекта — AI200 и AI250.
Компания делает ставку на энергоэффективные решения, способные конкурировать с GPU-платформами NVIDIA и ускорителями AMD в сегменте дата-центров.

Оба чипа построены на архитектуре Hexagon NPU и используют принцип микротайлового инференса — распределения задач по крошечным подблокам для минимизации задержек и оптимизации пропускной способности. Благодаря этому подходу AI200 и AI250 обеспечивают более предсказуемое время отклика и снижают энергопотребление при выполнении больших языковых моделей и систем компьютерного зрения.

Младшая версия AI200 ориентирована на масштабируемые кластеры корпоративного уровня и выходит на рынок в 2026 году. Старшая AI250, рассчитанная на облачные платформы и крупные AI-фермы, появится в 2027 году.

В обоих ускорителях реализована поддержка 64-битной адресации, аппаратного шифрования весов моделей и защита данных в процессе инференса — важный элемент концепции privacy-by-design. Qualcomm подчёркивает, что архитектура Hexagon теперь поддерживает не только FP8 и INT4-режимы вычислений, но и гибридное смешение форматов, что улучшает точность при генеративных задачах.

По данным компании, новые ускорители обеспечивают до 2,8 раз выше производительность на ватт, чем предыдущее поколение решений Qualcomm Cloud AI 100, при этом занимают меньше места в стойке. Главный акцент сделан на latency-чувствительных сценариях, включая real-time inference для генеративных моделей, персонализированных агентов и систем видеоаналитики.

Эксперты отмечают, что Qualcomm фактически выходит на рынок дата-центров с амбициями конкурировать с NVIDIA H200 и AMD MI325X, предлагая более дешёвую и «зелёную» альтернативу. С учётом растущего спроса на энергоэффективные ИИ-решения, появление AI200/AI250 может стать началом новой фазы оптимизации железа для инференса.

QR Telegram

Подписывайтесь на наш Telegram

Новости, сводки и разборы

Читайте также