RAG: как модели используют внешние знания

Термин глоссария

RAG


RAG — это подход, который соединяет языковую модель с внешними документами. Он помогает ИИ опираться не только на внутренние параметры, но и на фактические данные.

Короткое определение

RAG (Retrieval-Augmented Generation) — это метод, при котором модель перед генерацией ответа получает релевантные документы из базы данных или поиска и использует их как фактическую основу.

Подробное объяснение

RAG решает ключевую проблему LLM — ограниченность внутренних знаний. Модель хорошо рассуждает, но не знает последних обновлений, документов компании, внутренних справочников или конфиденциальных данных.

Схема RAG состоит из двух частей: — retrieval: поиск нужных документов через эмбеддинги; — generation: формирование ответа с опорой на найденные данные. Это позволяет выдавать точные, проверяемые ответы.

Такой подход используется в корпоративных ассистентах: модели получают доступ к внутренним регламентам, письмам, PDF, базам знаний, FAQ, тикетам или научным статьям.

RAG повышает точность, снижает галлюцинации и делает ответы привязанными к реальным данным. Особенно это важно в юриспруденции, медицине, HR, техподдержке, аналитике и документации.

RAG применяют GPT, Claude, Gemini — а в России его используют в продуктах на базе YandexGPT, GigaChat и VK AI, интегрируя модели в корпоративные поиски и ассистенты.

Популярные стеки — Chroma, Weaviate, Pinecone, Milvus, Elasticsearch, pgvector. Они создают векторные базы, которые хранят эмбеддинги для поиска.

RAG можно улучшать: — reranking для более точного отбора документов; — chunking с оптимальным разбиением; — multi-query для расширенного поиска; — chain-of-thought с объяснениями; — caching для ускорения ответов.

Примеры использования

  • Ассистент по внутренним документам компании.
  • Поиск по базе знаний с генерируемыми ответами.
  • Анализ длинных PDF с привязкой к источникам.
  • Поддержка клиентов на основе FAQ.
  • Экспертные ответы на основе научных статей.

Связанные термины

  • Эмбеддинги
  • Vector Search
  • Context Window
  • LLM
  • Квантизация

Категория термина

Работа с данными и векторами