Архитектура, ориентированная на высокие нагрузки
Avito AI работает внутри одной из самых нагруженных интернет-площадок страны, где ежедневно создаются сотни тысяч объявлений, загружаются миллионы изображений и выполняются десятки миллионов поисковых запросов. Поэтому инфраструктура платформы строится вокруг принципов высокой пропускной способности, отказоустойчивости и низкой задержки. AI-слой интегрирован напрямую в продуктовые сервисы: поиск, рекомендации, модерацию, обработку изображений и генерацию описаний.
Компания не раскрывает данные о внутренних кластерах, вычислительных мощностях или типах оборудования, однако по поведению сервисов очевидно, что инфраструктура построена на распределённых системах, которые способны масштабироваться под динамический трафик. Инференс работает непрерывно и обслуживает одновременно миллионы пользовательских запросов.
Многослойная структура ML-сервисов
Платформа разделена на несколько уровней, каждый из которых выполняет отдельную роль в обработке контента и пользовательских действий:
- видимый уровень — поиск, рекомендации, создание объявлений, генерация описаний;
- модерационный уровень — анализ изображений, проверка текста, выявление нарушений;
- антифрод-уровень — мониторинг активности, поведенческая аналитика, выявление подозрительных сценариев;
- мультимодальный уровень — работа A-Vision и моделей компьютерного зрения;
- NLP-уровень — анализ и генерация текста через семейство A-Vibe;
- аналитический уровень — обработка данных, прогнозирование и оценка качества контента;
- исследовательский уровень — эксперименты, прототипы, будущие модели.
Эта сегментация позволяет обновлять модели независимо друг от друга, поддерживать стабильность и минимизировать риски при выкатывании новых версий.
Инференс мультимодальных моделей
A-Vision — мультимодальная группа моделей — является одной из самых ресурсоёмких частей платформы. Её инференс должен работать с огромным массивом изображений, анализируя их качество, содержание и соответствие правилам. Задачи включают классификацию, определение категории, сопоставление изображения с текстом и определение нарушений.
Avito не публикует, на каких архитектурах построен мультимодальный инференс, но по поведению можно предположить:
- обработка происходит в нескольких потоках;
- система оптимизирована под батчевую загрузку изображений;
- существует механизм быстрого fallback на более лёгкие модели при пиковых нагрузках;
- результат инференса поступает в модерацию, поиск и анализ качества объявления.
NLP-инференс и работа A-Vibe
Текстовые модели A-Vibe отвечают за генерацию описаний, корректировку текста, распознавание намерений и структурирование данных. Их инференс должен быть быстрым, так как операция создания или редактирования объявления не должна занимать значительное время.
Особенности текстового инференса Avito AI:
- низкая задержка при генерации текста;
- адаптация к коротким и простым пользовательским вводам;
- устойчивость к «грязному» тексту — ошибкам, жаргону, неполному описанию;
- возможность тонкой корректировки генерации под разные категории товаров.
Инференс в поиске и рекомендациях
Поиск и рекомендации — самые чувствительные к задержкам процессы. Инференс должен работать в миллисекундном диапазоне, иначе снижается качество пользовательского опыта. AI-компоненты здесь выполняют:
- понимание запроса и намерения пользователя;
- анализ поведенческих сигналов;
- оценку релевантности объявлений;
- формирование персональной выдачи;
- динамическое ранжирование в реальном времени.
Avito не раскрывает, какие модели используются, однако характер выдачи указывает на гибридную архитектуру, где ML-ранжирование сочетается с классическими поисковыми индексами.
Модерационный инференс и безопасный контент
Модерация — одна из самых сложных и нагруженных частей AI-контуров. Система должна заранее отсеивать объявления, нарушающие правила, обнаруживать запрещённые товары и блокировать визуальный контент, который не подходит для публикации.
Особенности модерационного инференса:
- многослойная проверка (текст + изображение + поведение);
- обработка потоков без постоянного участия человека;
- встроенный механизм эскалации, когда AI передаёт решение модератору;
- использование нескольких моделей разной мощности.
Антифрод и потоковая аналитика
Антифрод-система анализирует многомиллионные последовательности действий пользователей, выявляя рискованные паттерны. Avito не раскрывает архитектуру, но антифрод работает в потоковом режиме — задержки в таких системах недопустимы, иначе возникает риск пропуска мошеннических схем.
Вероятно, это сочетание:
- поведенческих моделей;
- анализаторов сессий;
- скоринговых ML-алгоритмов;
- систем сигнатур и аномалий.
Цикл обновлений и контроль качества
Внутренняя инфраструктура Avito AI поддерживает регулярное обновление моделей без заметных для пользователя разрывов. Каждая новая версия проходит тестирование на стабильность и точность, а в случае деградации качества система автоматически переключается на предыдущую версию.
Компания не раскрывает детали ML-пайплайнов, но по устойчивости сервисов видно, что применяется строгий контроль качества моделей и постепенная выкладка обновлений в продакшен.
Итог
Инфраструктура и инференс Avito AI — это многослойная, распределённая система, работающая под высокой нагрузкой и обрабатывающая огромный объём мультимодального контента. Несмотря на то что технические детали остаются закрытыми, можно утверждать: платформа построена вокруг принципов устойчивости, скорости, сегментации и непрерывного улучшения. Это делает Avito AI зрелой технологией промышленного уровня.