Инфраструктура и инференс Avito AI — как работает AI-ядро

Архитектура, ориентированная на высокие нагрузки

Avito AI работает внутри одной из самых нагруженных интернет-площадок страны, где ежедневно создаются сотни тысяч объявлений, загружаются миллионы изображений и выполняются десятки миллионов поисковых запросов. Поэтому инфраструктура платформы строится вокруг принципов высокой пропускной способности, отказоустойчивости и низкой задержки. AI-слой интегрирован напрямую в продуктовые сервисы: поиск, рекомендации, модерацию, обработку изображений и генерацию описаний.

Компания не раскрывает данные о внутренних кластерах, вычислительных мощностях или типах оборудования, однако по поведению сервисов очевидно, что инфраструктура построена на распределённых системах, которые способны масштабироваться под динамический трафик. Инференс работает непрерывно и обслуживает одновременно миллионы пользовательских запросов.

Многослойная структура ML-сервисов

Платформа разделена на несколько уровней, каждый из которых выполняет отдельную роль в обработке контента и пользовательских действий:

видимый уровень — поиск, рекомендации, создание объявлений, генерация описаний;
модерационный уровень — анализ изображений, проверка текста, выявление нарушений;
антифрод-уровень — мониторинг активности, поведенческая аналитика, выявление подозрительных сценариев;
мультимодальный уровень — работа A-Vision и моделей компьютерного зрения;
NLP-уровень — анализ и генерация текста через семейство A-Vibe;
аналитический уровень — обработка данных, прогнозирование и оценка качества контента;
исследовательский уровень — эксперименты, прототипы, будущие модели.

Эта сегментация позволяет обновлять модели независимо друг от друга, поддерживать стабильность и минимизировать риски при выкатывании новых версий.

Инференс мультимодальных моделей

A-Vision — мультимодальная группа моделей — является одной из самых ресурсоёмких частей платформы. Её инференс должен работать с огромным массивом изображений, анализируя их качество, содержание и соответствие правилам. Задачи включают классификацию, определение категории, сопоставление изображения с текстом и определение нарушений.

Avito не публикует, на каких архитектурах построен мультимодальный инференс, но по поведению можно предположить:

обработка происходит в нескольких потоках;
система оптимизирована под батчевую загрузку изображений;
существует механизм быстрого fallback на более лёгкие модели при пиковых нагрузках;
результат инференса поступает в модерацию, поиск и анализ качества объявления.

NLP-инференс и работа A-Vibe

Текстовые модели A-Vibe отвечают за генерацию описаний, корректировку текста, распознавание намерений и структурирование данных. Их инференс должен быть быстрым, так как операция создания или редактирования объявления не должна занимать значительное время.

Особенности текстового инференса Avito AI:

низкая задержка при генерации текста;
адаптация к коротким и простым пользовательским вводам;
устойчивость к «грязному» тексту — ошибкам, жаргону, неполному описанию;
возможность тонкой корректировки генерации под разные категории товаров.

Инференс в поиске и рекомендациях

Поиск и рекомендации — самые чувствительные к задержкам процессы. Инференс должен работать в миллисекундном диапазоне, иначе снижается качество пользовательского опыта. AI-компоненты здесь выполняют:

понимание запроса и намерения пользователя;
анализ поведенческих сигналов;
оценку релевантности объявлений;
формирование персональной выдачи;
динамическое ранжирование в реальном времени.

Avito не раскрывает, какие модели используются, однако характер выдачи указывает на гибридную архитектуру, где ML-ранжирование сочетается с классическими поисковыми индексами.

Модерационный инференс и безопасный контент

Модерация — одна из самых сложных и нагруженных частей AI-контуров. Система должна заранее отсеивать объявления, нарушающие правила, обнаруживать запрещённые товары и блокировать визуальный контент, который не подходит для публикации.

Особенности модерационного инференса:

многослойная проверка (текст + изображение + поведение);
обработка потоков без постоянного участия человека;
встроенный механизм эскалации, когда AI передаёт решение модератору;
использование нескольких моделей разной мощности.

Антифрод и потоковая аналитика

Антифрод-система анализирует многомиллионные последовательности действий пользователей, выявляя рискованные паттерны. Avito не раскрывает архитектуру, но антифрод работает в потоковом режиме — задержки в таких системах недопустимы, иначе возникает риск пропуска мошеннических схем.

Вероятно, это сочетание:

поведенческих моделей;
анализаторов сессий;
скоринговых ML-алгоритмов;
систем сигнатур и аномалий.

Цикл обновлений и контроль качества

Внутренняя инфраструктура Avito AI поддерживает регулярное обновление моделей без заметных для пользователя разрывов. Каждая новая версия проходит тестирование на стабильность и точность, а в случае деградации качества система автоматически переключается на предыдущую версию.

Компания не раскрывает детали ML-пайплайнов, но по устойчивости сервисов видно, что применяется строгий контроль качества моделей и постепенная выкладка обновлений в продакшен.

Итог

Инфраструктура и инференс Avito AI — это многослойная, распределённая система, работающая под высокой нагрузкой и обрабатывающая огромный объём мультимодального контента. Несмотря на то что технические детали остаются закрытыми, можно утверждать: платформа построена вокруг принципов устойчивости, скорости, сегментации и непрерывного улучшения. Это делает Avito AI зрелой технологией промышленного уровня.

Экосистемы

Инфраструктура