Термин глоссария

RAG

RAG — это подход, который соединяет языковую модель с внешними документами. Он помогает ИИ опираться не только на внутренние параметры, но и на фактические данные.

Короткое определение

RAG (Реtrieval-Augmented Generation) — это метод, при котором модель перед генерацией ответа получает релевантные документы из базы данных или поиска и использует их как фактическую основу.

Подробное объяснение

RAG решает ключевую проблему LLM — ограниченность внутренних знаний. Модель хорошо рассуждает, но не знает последних обновлений, документов компании, внутренних справочников или конфиденциальных данных.

Схема RAG состоит из двух частей: — retrieval: поиск нужных документов через эмбеддинги; — generation: формирование ответа с опорой на найденные данные. Это позволяет выдавать точные, проверяемые ответы.

Такой подход используется в корпоративных ассистентах: модели получают доступ к внутренним регламентам, письмам, PDF, базам знаний, FAQ, тикетам или научным статьям.

RAG повышает точность, снижает галлюцинации и делает ответы привязанными к реальным данным. Особенно это важно в юриспруденции, медицине, HR, техподдержке, аналитике и документации.

RAG применяют GPT, Claude, Gemini — а в России его используют в продуктах на базе YandexGPT, GigaChat и VK AI, интегрируя модели в корпоративные поиски и ассистенты.

Популярные стеки — Chroma, Weaviate, Pinecone, Milvus, Elasticsearch, pgvector. Они создают векторные базы, которые хранят эмбеддинги для поиска.

RAG можно улучшать: — reranking для более точного отбора документов; — chunking с оптимальным разбиением; — multi-query для расширенного поиска; — chain-of-thought с объяснениями; — caching для ускорения ответов.

Примеры использования

Ассистент по внутренним документам компании.
Поиск по базе знаний с генерируемыми ответами.
Анализ длинных PDF с привязкой к источникам.
Поддержка клиентов на основе FAQ.
Экспертные ответы на основе научных статей.

Связанные термины

Эмбеддинги
Vector Search
Context Window
LLM
Квантизация

Категория термина

Работа с данными и векторами

Экосистемы

RAG

Короткое определение

Подробное объяснение

Примеры использования

Связанные термины

Категория термина