NPU: локальный ИИ на смартфонах и ноутбуках

Термин глоссария

NPU


NPU — это чип, который приносит искусственный интеллект на смартфоны, ноутбуки и edge-устройства. Он обеспечивает быстрый и энергоэффективный инференс прямо на устройстве.

Короткое определение

NPU (Neural Processing Unit) — энергоэффективный ускоритель, предназначенный для локальных ИИ-вычислений: обработки изображений, речи, генерации и работы компактных моделей прямо на устройстве.

Подробное объяснение

NPU — ответ на потребность запускать ИИ не только в облаке, но и на личных устройствах. Он оптимизирован под маломощные, но частые операции: свёртки, матричные вычисления, обработку аудио и визуальных данных.

NPU располагается в мобильных процессорах: Apple Neural Engine, Qualcomm Hexagon, Samsung NPU, Huawei Ascend. Он позволяет выполнять ИИ-обработку без загрузки CPU и GPU.

Благодаря NPU смартфоны могут распознавать речь, классифицировать изображения, применять фотофильтры, ускорять камеры и запускать компактные LLM.

На ноутбуках NPU становится драйвером «AI PC» — Windows-устройства используют его для Copilot+, локальных моделей, шумоподавления и мультимедийных задач.

В edge-системах NPU используется для IoT, камер наблюдения, промышленных датчиков и автономных устройств, где важна скорость и энергоэффективность.

Примеры использования

  • Обработка фото и видео на смартфоне.
  • Распознавание речи на устройстве.
  • Генерация контента в локальных приложениях.
  • Запуск компактных моделей LLM без облака.
  • Интеллектуальные edge-камеры и датчики.

Связанные термины

  • GPU
  • TPU
  • CPU
  • Инференс
  • Квантизация

Категория термина

Аппаратное ускорение • Инференс и производительность