Почему это важно
МТС использует серверные чипы Huawei и архитектуру Ascend для выполнения инференса моделей. Это позволяет запускать крупные нейросети без задержек и обеспечивать высокую пропускную способность при большом количестве пользователей.
Преимущества
- высокая скорость обработки запросов;
- низкая латентность для диалоговых моделей;
- энергоэффективность под нагрузкой;
- возможность масштабирования в дата-центрах МТС;
- стабильность при работе с мультимодальными моделями.
Где применяется инференс
- mGPT, mTTS, mASR при массовых пользовательских запросах;
- Vision-обработка в реальном времени;
- корпоративные AI-решения;
- сервисы поддержки и контакт-центры;
- B2B-интеграции с высокими SLA.
Итог
Использование чипов Ascend — один из ключевых факторов, позволяющих МТС держать модели быстрыми, стабильными и пригодными для тяжёлых сценариев.