📚

Модуль 6.2: RAG — агент с базой знаний

Что такое RAG: архитектура, когда нужен

RAG — шпаргалка для LLM. Разбираем архитектуру Indexing → Retrieval → Generation, сравниваем с fine-tuning и long context.

Эмбеддинги превращают текст в вектор, сохраняя смысл. Cosine similarity, модели OpenAI/Cohere, генерация на TypeScript.

Сравнение векторных баз данных. Поднимаем Qdrant в Docker, создаём коллекцию, индексируем документы, ищем похожие.

Семантический vs ключевой поиск. Гибридный поиск через RRF, reranking через Cohere — золотой стандарт RAG.

Chunking стратегии (fixed, recursive, semantic), поиск как tool агента, полный пайплайн от документа до ответа.

Precision, recall, faithfulness, relevancy — четыре метрики RAG. Evaluation dataset, LLM-as-judge, дебаг плохих ответов.