主题
模块五:RAG(检索增强生成)
🎯 目标:从原理到实现,搞懂 RAG 全链路
┌──────────────────────────────────────────────────────────────┐
│ RAG 是什么? │
│ │
│ 问题: LLM 的知识有截止日期,也不知道你的私有数据 │
│ 解决: 检索相关文档 → 塞进 Prompt → 让 LLM 基于文档回答 │
│ │
│ RAG = Retrieval-Augmented Generation │
│ 检索 增强 生成 │
│ │
│ ┌──────────────────────────────────────────────────────┐ │
│ │ │ │
│ │ 用户提问: "公司的退款政策是什么?" │ │
│ │ │ │ │
│ │ ▼ │ │
│ │ ┌──────────┐ ┌──────────────────┐ │ │
│ │ │ Embedding │──▶│ 向量数据库 │ │ │
│ │ │ 向量化查询│ │ 检索最相关的文档 │ │ │
│ │ └──────────┘ └────────┬─────────┘ │ │
│ │ │ │ │
│ │ ┌────────────────────┘ │ │
│ │ ▼ │ │
│ │ ┌──────────────────────────────────────────────┐ │ │
│ │ │ Prompt = 系统指令 + 检索到的文档 + 用户问题 │ │ │
│ │ └───────────────────────┬──────────────────────┘ │ │
│ │ ▼ │ │
│ │ ┌──────────┐ │ │
│ │ │ LLM │ │ │
│ │ │ 基于文档 │ │ │
│ │ │ 生成回答 │ │ │
│ │ └──────────┘ │ │
│ │ │ │
│ └──────────────────────────────────────────────────────┘ │
│ │
└──────────────────────────────────────────────────────────────┘| 序号 | 文件 | 内容 |
|---|---|---|
| 01 | RAG 全链路详解 | 分块、向量化、检索、生成、优化 |
| 02 | Go 实现 RAG | 从零用 Go 写一个简单的 RAG 系统 |
推荐资源
- 📖 RAG Survey Paper — 综述论文
- 📺 RAG from Scratch - LangChain
- 📖 Chunking Strategies — Pinecone 教程