Skip to content

模块五:RAG(检索增强生成)

🎯 目标:从原理到实现,搞懂 RAG 全链路

┌──────────────────────────────────────────────────────────────┐
│                       RAG 是什么?                             │
│                                                              │
│  问题: LLM 的知识有截止日期,也不知道你的私有数据               │
│  解决: 检索相关文档 → 塞进 Prompt → 让 LLM 基于文档回答       │
│                                                              │
│  RAG = Retrieval-Augmented Generation                        │
│        检索       增强      生成                               │
│                                                              │
│  ┌──────────────────────────────────────────────────────┐    │
│  │                                                      │    │
│  │  用户提问: "公司的退款政策是什么?"                      │    │
│  │      │                                               │    │
│  │      ▼                                               │    │
│  │  ┌──────────┐    ┌──────────────────┐                │    │
│  │  │ Embedding │──▶│ 向量数据库        │                │    │
│  │  │ 向量化查询│    │ 检索最相关的文档  │                │    │
│  │  └──────────┘    └────────┬─────────┘                │    │
│  │                           │                          │    │
│  │      ┌────────────────────┘                          │    │
│  │      ▼                                               │    │
│  │  ┌──────────────────────────────────────────────┐    │    │
│  │  │ Prompt = 系统指令 + 检索到的文档 + 用户问题   │    │    │
│  │  └───────────────────────┬──────────────────────┘    │    │
│  │                          ▼                          │    │
│  │                    ┌──────────┐                      │    │
│  │                    │   LLM    │                      │    │
│  │                    │ 基于文档  │                      │    │
│  │                    │ 生成回答  │                      │    │
│  │                    └──────────┘                      │    │
│  │                                                      │    │
│  └──────────────────────────────────────────────────────┘    │
│                                                              │
└──────────────────────────────────────────────────────────────┘
序号文件内容
01RAG 全链路详解分块、向量化、检索、生成、优化
02Go 实现 RAG从零用 Go 写一个简单的 RAG 系统

推荐资源