Agent loop — управляющий цикл в LLM-агентах, объединяющий наблюдение, рассуждение, выполнение действий и обратную связь в повторяющуюся последовательность.
Определение
Agent loop — это архитектурный паттерн, описывающий работу автономного или полуавтономного агента на базе LLM. В рамках этого цикла модель получает текущее состояние среды, анализирует его, формирует план или решение, выполняет действие (через инструменты, API или внутренние операции), затем оценивает результат и при необходимости запускает следующий шаг. Agent loop лежит в основе LLM-агентов, инструментальных ассистентов и систем автоматизации задач.
Как работает
1. Observation (наблюдение)
Агент получает входные данные:
- пользовательский запрос;
- результаты предыдущих действий;
- состояние среды (файлы, БД, веб-страницы, логи);
- ограничения и правила.
Это формирует текущее состояние, с которым работает агент.
2. Reasoning / Planning (анализ и планирование)
LLM интерпретирует состояние и решает, что делать дальше:
- разбивает задачу на шаги;
- выбирает инструмент или стратегию;
- оценивает риски и условия остановки;
- формирует следующий action.
Планирование может быть явным (plan → execute) или неявным, встроенным в генерацию.
3. Action (действие)
Агент выполняет выбранное действие:
- вызов API или функции;
- поиск через retrieval pipeline;
- запуск кода;
- изменение состояния среды.
Результат действия возвращается агенту как новое наблюдение.
4. Evaluation / Feedback (оценка)
Агент анализирует результат:
- достигнута ли цель;
- нужно ли повторить шаг;
- возникли ли ошибки;
- требуется ли корректировка плана.
Если цель не достигнута, цикл запускается снова.
5. Условия остановки
- выполнение задачи;
- достижение лимита шагов;
- ошибка или недоступность ресурсов;
- ручная остановка пользователем.
Где применяется
- LLM-агенты и tool-using ассистенты.
- Автоматизация задач и workflow.
- Conversational AI с состоянием.
- Code agents и DevOps-агенты.
- Агенты для поиска, анализа и планирования.
Практические примеры использования
В RAG-агентах agent loop используется для итеративного поиска: агент формирует запрос, выполняет retrieval, оценивает качество контекста и при необходимости переписывает запрос. В code agents цикл включает анализ ошибки компиляции, правку кода и повторный запуск.
В автономных системах агент может выполнять десятки итераций, постепенно уточняя план и адаптируясь к состоянию среды.
Ключевые свойства
- Циклическая архитектура с обратной связью.
- Поддержка многошаговых задач.
- Интеграция с инструментами и средой.
- Гибкость планирования.
- Состояние сохраняется между шагами.
Проблемы и ограничения
- Риск бесконечных или зацикленных действий.
- Рост латентности и стоимости.
- Ошибки планирования на ранних шагах.
- Сложность контроля и отладки.
- Повышенные требования к safety-ограничениям.
Преимущества и ограничения
- Плюс: возможность решать сложные многошаговые задачи.
- Минус: сложность управления и высокая стоимость выполнения.
Связанные термины
- LLM agent
- Tool calling
- Planning
- Autonomous agents
- RAG