Agent loop в LLM-агентах и системах

Термин глоссария

Agent loop


Agent loop — управляющий цикл в LLM-агентах, объединяющий наблюдение, рассуждение, выполнение действий и обратную связь в повторяющуюся последовательность.

Определение

Agent loop — это архитектурный паттерн, описывающий работу автономного или полуавтономного агента на базе LLM. В рамках этого цикла модель получает текущее состояние среды, анализирует его, формирует план или решение, выполняет действие (через инструменты, API или внутренние операции), затем оценивает результат и при необходимости запускает следующий шаг. Agent loop лежит в основе LLM-агентов, инструментальных ассистентов и систем автоматизации задач.

Как работает

1. Observation (наблюдение)

Агент получает входные данные:

  • пользовательский запрос;
  • результаты предыдущих действий;
  • состояние среды (файлы, БД, веб-страницы, логи);
  • ограничения и правила.

Это формирует текущее состояние, с которым работает агент.

2. Reasoning / Planning (анализ и планирование)

LLM интерпретирует состояние и решает, что делать дальше:

  • разбивает задачу на шаги;
  • выбирает инструмент или стратегию;
  • оценивает риски и условия остановки;
  • формирует следующий action.

Планирование может быть явным (plan → execute) или неявным, встроенным в генерацию.

3. Action (действие)

Агент выполняет выбранное действие:

  • вызов API или функции;
  • поиск через retrieval pipeline;
  • запуск кода;
  • изменение состояния среды.

Результат действия возвращается агенту как новое наблюдение.

4. Evaluation / Feedback (оценка)

Агент анализирует результат:

  • достигнута ли цель;
  • нужно ли повторить шаг;
  • возникли ли ошибки;
  • требуется ли корректировка плана.

Если цель не достигнута, цикл запускается снова.

5. Условия остановки

  • выполнение задачи;
  • достижение лимита шагов;
  • ошибка или недоступность ресурсов;
  • ручная остановка пользователем.

Где применяется

  • LLM-агенты и tool-using ассистенты.
  • Автоматизация задач и workflow.
  • Conversational AI с состоянием.
  • Code agents и DevOps-агенты.
  • Агенты для поиска, анализа и планирования.

Практические примеры использования

В RAG-агентах agent loop используется для итеративного поиска: агент формирует запрос, выполняет retrieval, оценивает качество контекста и при необходимости переписывает запрос. В code agents цикл включает анализ ошибки компиляции, правку кода и повторный запуск.

В автономных системах агент может выполнять десятки итераций, постепенно уточняя план и адаптируясь к состоянию среды.

Ключевые свойства

  • Циклическая архитектура с обратной связью.
  • Поддержка многошаговых задач.
  • Интеграция с инструментами и средой.
  • Гибкость планирования.
  • Состояние сохраняется между шагами.

Проблемы и ограничения

  • Риск бесконечных или зацикленных действий.
  • Рост латентности и стоимости.
  • Ошибки планирования на ранних шагах.
  • Сложность контроля и отладки.
  • Повышенные требования к safety-ограничениям.

Преимущества и ограничения

  • Плюс: возможность решать сложные многошаговые задачи.
  • Минус: сложность управления и высокая стоимость выполнения.

Связанные термины

  • LLM agent
  • Tool calling
  • Planning
  • Autonomous agents
  • RAG

Категория термина

Безопасность и взаимодействие