大模型 RAG 进阶实战营课程大纲

· · · AI大模型 ·

本训练营是一个面向实战的 RAG 开发课程，将带领学员从零开始构建企业级 RAG 应用。

### 课程特色

1. **实战导向**：通过 4 个真实项目案例，覆盖金融、医疗、企业合规等多个领域的 RAG 应用场景。
2. **DeepSeek 助力开发**：
   - 使用 DeepSeek 开源大模型进行 RAG 系统开发
   - 利用 DeepSeek 强大的推理、代码理解和生成能力，加速开发过程
   - 支持中英双语开发，适合国内开发场景

3. **Cursor 智能编程**：
   - 使用 Cursor 作为主要 IDE 工具
   - 实时 AI 编程助手，提供代码补全和优化建议
   - 快速调试和问题诊断能力

4. **完整技术栈**：
   - 从数据处理到系统部署的全流程实践
   - 11 节核心技术详解，深入 RAG 各个环节
   - 前沿技术探索，包括 GraphRAG、Agentic RAG 等最新进展

通过 DeepSeek + Cursor 的协同，学员将体验到 AI 辅助下的高效 RAG 开发流程，快速掌握 RAG 系统的搭建与优化技巧。

### 准备篇 安装最新版 Cursor 并配置 DeepSeek 等大模型

**说明**：

指导安装最新版 Cursor，并配置最新的大模型（如 DeepSeek-V3、DeepSeek-R1、GPT-4o、Claude-3.5 Sonnet 等），实现高效的 AI 开发环境。此外，还将涵盖 RAG 相关工具的配置，助力智能检索与内容生成任务。

**详细内容**

1. **安装最新版 Cursor**
   - 介绍 Cursor 的特点及其对 AI 编程的优化
   - 下载安装最新版本的 Cursor
   - 配置适用于大模型开发的环境与插件

2. **配置 DeepSeek 等大模型**
   - 安装并配置 DeepSeek-V3、DeepSeek-R1
   - 介绍 GPT-4o/DeepSeek-V3/DeepSeek-R1 的区别及适用场景
   - 配置 API 调用，支持在 Cursor 内无缝切换不同模型

### 第一部分：RAG 基础和 RAG 真实落地项目实战

#### 第一课 RAG 三问

**说明**：通过三个问题，快速了解 RAG 的核心概念、应用场景和优化方向，为后续学习打下基础。

1. 掌握 RAG 的基本概念和整体框架

2. 了解 RAG 的典型应用场景和优势
3. 明确 RAG 系统的关键优化方向和步骤

##### 详细内容

1. **RAG 的整体框架和技术组件是什么？**
   - 详解 RAG 的三个核心组成部分：文档读取、检索和生成
   - 10 大核心组件：文档导入、文本分块、嵌入、向量存储、查询优化、检索、检索后处理、生成、评估、整体流程优化
   - RAG 的完整流程，并讲解每个环节的作用和意义

2. **如何快速搭建 RAG 系统？**
   - 使用 LlamaIndex 和 LangChain 快速搭建 RAG 系统（在 GPT-o1/DeepSeek-V3/R1 等最新大模型间任意切换）
   - 不使用框架，直接用嵌入模型、向量数据库和 LLM 搭建 RAG 系统
   - 使用 Coze、Dify 和 Ragflow 等可视化工具搭建 RAG 系统

3. **从何处入手优化 RAG 系统？**
   - 分块策略：不同粒度对检索效率和准确度的影响
   - 嵌入策略：如何选择合适的嵌入模型和向量数据库
   - 检索策略：关键词检索、语义检索和混合检索的优缺点
   - 生成策略：如何控制生成内容的质量和相关性
   - 评估体系：如何评估 RAG 系统的性能和效果

#### 第二课 实战项目-1：构建自己的 RAG 前端和后端框架

**说明**：本课及后续几个项目实战旨在让学员快速搭建完整项目，搭建起基于本地知识库的企业问答系统，并初步运行 RAG 系统。后续章节的核心技术详解篇仍将基于这些项目逐步优化 RAG 系统，并在过程中逐步深化对 RAG 各个组件的理解。

**项目目标：**

- 掌握 RAG 前端框架的设计和开发

- 学习如何与后端 RAG 系统进行交互

- 实现用户友好的界面和交互体验

- 自己搭建框架，便于评估，调试

- 自主配置各种 RAG Pipeline, 文档解析器，嵌入模型和生成模型

**项目内容：**

- 设计前端界面，包括用户输入、结果展示、交互功能等

- 使用 JavaScript、HTML、CSS 等技术实现前端框架

- 与后端 RAG 系统进行 API 对接，实现数据传输和交互

- 优化前端性能，提升用户体验

#### 第三课 实战项目-2：金融/医疗领域专有词汇标准化系统开发

**说明**：金融/医疗领域有自己的特定术语系统，如何在金融（或医疗）文档中识别这些术语，并进行标准化处理，可以节省从业人员的时间成本，提升工作效率，同时提高文档的专业程度。

**项目目标：**

- 掌握金融/科技专有词汇标准化系统的开发

- 学习如何处理金融/医疗领域的专业术语，将非标准化术语通过 RAG 和检索系统进行标准化，以及缩略语的自动扩写

- 构建一个可以对专有词汇进行标准化的 RAG 系统

**项目内容：**

- 收集整理银行/医疗领域的专有词汇和相关文档

- 构建 RAG 系统，实现对专有词汇的识别和标准化

#### 第四课 实战项目-3：企业文档合规性检索和问答系统开发

**说明**：企业文档合规性检索和问答系统开发，通过 RAG 系统帮助企业进行合规性审查，提升工作效率，同时降低合规风险。

**项目目标：**

- 掌握企业文档合规性检索和问答系统的开发

- 学习如何处理法律法规、行业标准等文档

- 构建一个可以帮助企业进行合规性审查的 RAG 系统

**项目内容：**

- 收集整理企业内部文档和相关法律法规、行业标准等

- 对文档进行预处理，包括分词、实体识别等

- 构建 RAG 系统，实现对文档的检索和问答功能

- 尝试 BM25、Naive RAG、混合检索等多种算法

- 对系统进行评估和优化，提升准确性和效率

#### 第五课 实战项目-4：基于 GraphRAG、LightRAG 和 LazyGraphRAG 的知识图谱 RAG 系统构建

**说明**：近年来，知识图谱在企业 RAG 系统中得到了越来越广泛的应用，本项目将实现医学领域的医疗术语的知识图谱的构建和可视化，同时可以进行知识推理和问答。

**项目目标：**

- 掌握基于图的 RAG 系统的构建

- 学习 GraphRAG、LightRAG 和 LazyGraphRAG 等方法

- 构建一个可以进行知识推理和问答的 RAG 系统

**项目内容：**

- 收集整理知识图谱数据

- 基于知识图谱构建 RAG 系统

## 第二部分：RAG 各组件与核心技术详细拆解

## 第一课：数据导入技术

### 教学目标：

掌握从不同来源导入数据的技巧，包括文本、表格、图像、网页等，为 RAG 系统提供丰富的数据支持。

1. 学会使用不同的数据加载器读取各种格式的文档，尤其是复杂 PDF 的解析方式

1. 掌握处理图像和网页数据的技巧

1. 了解如何保留文档的结构化信息

### 详细内容：

1. 简单文本的读取：

1. 使用 LangChain 和 LlamaIndex 读取 txt 文档

1. 各种主要文档加载器的介绍和使用

1. 表格数据的导入：

1. 使用 Unstructured 处理 CSV 数据

1. 自动形成和手动指定元数据

1. PDF 图像\表格和网页数据的处理：

1. 使用 OCR 技术识别图像中的文字

1. 利用 LLM 解析图文信息

1. 爬取网页数据并进行解析

**实战**：重构实战项目 1 和 3 中的数据导入部分。

## 第二课：文本分块技术

### 教学目标：

理解文本分块的重要性，掌握不同的分块策略，并学习如何优化分块效果。

1. 理解分块对 RAG 系统的影响

1. 掌握按大小、格式和语义进行分块的技巧

1. 学习如何为文本块添加元数据

### 详细内容：

1. 分块的重要性：

1. 影响检索效率和准确度

1. 避免 LLM 的上下文窗口限制

1. 不同的分块策略：

1. 按大小分块：固定长度、滑动窗口等

1. 按格式分块：段落、课节等

1. 按语义分块：主题、实体等

1. 高级分块技巧：

1. 使用 Tiktoken 计算 Token 数量

1. 为文本块添加元数据

1. 构建多层次索引

**实战**：重构实战项目 1 和 3 中的文本分块部分。

## 第三课：嵌入技术

### 教学目标：

了解嵌入模型的原理，掌握不同嵌入模型的特点，并学习如何选择合适的嵌入模型。

1. 掌握嵌入模型的基本概念和作用

1. 了解不同嵌入模型的优缺点和适用场景

1. 学习如何评估嵌入模型的效果

### 详细内容：

1. 嵌入模型的原理：

1. 将文本转换为向量表示。

1. 捕捉文本的语义信息。

1. 不同嵌入模型的特点：

1. 商用模型：OpenAI、Cohere、VoyageAI 等

1. 开源模型：BGE、Sentence Transformer 等

1. 实战案例：使用 OpenAI 嵌入模型进行文本聚类

1. 嵌入模型的评估和选择：

1. MTEB 基准测试

1. 稀疏嵌入和密集嵌入

1. 重排序模型

**实战**：重构实战项目 1、2、3 中的嵌入部分。

## 第四课：向量存储和索引技术

### 教学目标：

掌握向量数据库的工作原理，了解不同向量数据库的特点，并学习如何选择和使用向量数据库。

不同索引的区别、维度区别、如何加速索引，Query 和 Search 的区别和组合。

1. 理解向量数据库的基本概念和作用

1. 了解不同向量数据库的优缺点和适用场景

1. 学习如何优化向量数据库的性能

### 详细内容：

1. 向量数据库的工作原理：

1. 存储和检索文本向量

1. 加速语义检索

1. 不同向量数据库的特点：

1. Milvus、Weaviate、Qdrant 等

1. 索引和搜索设置

1. 实战案例：使用 Milvus 构建 RAG 系统

1. 向量数据库的高级应用：

1. 混合嵌入和混合检索（稀疏检索 + 密集检索/BM25 + ANN 相似度检索）

1. 多模态检索

**实战**：重构实战项目 1、2、3、4 中的向量存储部分。

## 第五课：预检索-查询优化技术

### 教学目标：

学习如何优化查询语句，提高检索效率和准确度。

1. 掌握查询重写、分解和澄清的技巧

1. 了解查询路由和扩展的应用

### 详细内容：

1. 查询构建（Query Rewriting）：

1. Text-to-SQL：将自然语言转换为 SQL 语句

1. Text-to-Cypher：适配图数据库的查询转换

1. Self-query Retriever：自动从查询中提取结构化信息

1. 查询优化（Query Translation）：

1. 查询重写（Query Rewriting）：使用 LLM 优化查询语句改写原始查询以提高准确性

1. 查询分解（Query Decomposition）：将复杂查询拆分为多个子查询

1. 查询澄清（Query Clarification）：通过交互明确用户意图

1. 查询扩展 - HyDE：生成假设文档来增强查询效果

1. 查询路由：

1. 语义路由：根据查询内容选择合适的知识库

1. 定义路由：基于预设规则进行查询分发

**实战**：重构实战项目 1、2、3、4 中的查询优化部分。

## 第六课：提升检索准确性的方法

### 教学目标：

学习如何优化检索策略，包括索引结构、检索算法和结果排序等，

讲解如何利用多路知识来源，以及上下文窗口过大的处理等。

1. 掌握不同的检索策略和技巧

1. 学习如何处理各种检索问题

### 详细内容：

1. 检索策略：

1. 从小到大：节点-句子滑动窗口技术

1. 粗中有细：RecursiveRetriever 构建多层次索引

1. 分层合并：组合相关节点

1. 混合查询：结合关键词检索和语义检索

1. 检索问题和解决方法：

1. 关键文档未被检索到

1. 关键文档排名过低

1. 检索结果不够全面或过于宽泛

1. 检索结果过于冗长

**实战**：重构实战项目 1、2、3、4 中的检索部分。

## 第七课：检索后处理技术

### 教学目标：

学习如何对检索结果进行后处理，包括重排、压缩和校正等，进一步提高 RAG 系统的性能。

1. 掌握不同的检索后处理技术

1. 了解各种后处理技术的优缺点和适用场景

### 详细内容：

1. 重排：

1. 根据语义相似度、时效等因素对检索结果重新排序

1. RRF、CrossEncoder Reranking 等方法

1. 压缩：

1. 精简检索结果，避免 LLM 的上下文窗口限制

1. LLMLingua、RECOMP 等方法

1. 校正：

1. 纠正检索结果中的错误和偏差

1. Corrective RAG 等方法

**实战**：重构实战项目 1、2、3、4 中的检索后处理部分。

## 第八课：生成过程中的技术

### 教学目标：

学习如何优化生成过程，包括提示设计、结果规范化和内容控制等，从而提高 RAG 系统的输出质量。

1. 掌握不同的生成优化技术

1. 了解如何将检索结果融入生成过程

### 详细内容：

1. 提示设计：

1. 规范化生成结果

1. 控制生成内容的准确性和多样性

1. 检索结果集成方式：

1. 输入层集成、输出层集成和中间层集成

1. 高级生成技术：

1. Self-RAG：自我反思式生成

1. RRR：动态生成优化

**实战**：重构实战项目 1、2、3、4 中的生成部分。

## 第九课：评估检索结果的技术

### 教学目标：

学习如何评估 RAG 系统的性能，包括检索评估和响应评估，并掌握不同的评估指标和框架。

1. 了解 RAG 系统的评估体系

1. 掌握不同的评估指标和框架

1. 学习如何利用评估结果优化 RAG 系统

### 详细内容：

1. 评估指标：

1. 检索评估：精确率、召回率、F1 值等

1. 响应评估：语义相似度、忠实度等

1. 评估框架：

1. RAGAS、Phoenix、TruLens 等

1. 评估结果的应用：

1. 优化分块策略、嵌入模型、检索算法等

1. 构建高性能 RAG 系统

**实战**：可以通过本课内容，重构实战项目 1、2、3、4 中的评估部分。

## 第十课：复杂检索策略和范式

### 教学目标：

了解 RAG 的高级应用和未来发展趋势，包括图检索、多模态检索、迭代式检索等。

1. 掌握 GraphRAG、Contextual Retrieval 等高级检索技术

1. 了解多模态 RAG、Agentic-RAG 等前沿研究方向

### 详细内容：

1. GraphRAG：

1. 利用图结构增强语义检索

1. 构建知识图谱，实现更精准的知识问答

1. Contextual Retrieval：

1. 基于上下文和多轮对话的高级检索策略

1. 实现对结构化数据的精准检索

1. 多模态 RAG：

1. 融合图像、视频等多模态信息

1. 实现更全面的信息检索和理解

1. Agentic-RAG：

1. 基于 Agent 的检索和生成策略

1. Agent 作为检索控制器，实现更智能的检索和生成

1. 动态检索路径（Dynamic Retrieval Planning）

## 第十一课：其他工具、论文和开源项目

### 教学目标：

RAG 领域的前沿进展，拓展 RAG 领域的知识和视野，了解更多的工具、论文和开源项目。

### 详细内容：

1. Modular RAG：

1. 构建可插拔的 RAG 系统

1. 提高系统的灵活性和可扩展性

1. RAG + Fine-tuning：

1. 结合 RAG 和微调技术

1. 进一步提高 LLM 的性能

1. RAG 相关论文和开源项目：

1. 同济大学综述论文：Retrieval-Augmented Generation for Large Language Models: A Survey

1. 香港理工大学综述：A Survey on RAG Meeting LLMs: Towards Retrieval-Augmented Large Language Models

1. LightRAG、StructRAG、LazyGraphRAG、Agentic-RAG 等最新进展

## 加餐篇 DeepSeek-V3 及 DeepSeek-R1 技术详解

**说明**：介绍 DeepSeek 系列模型的技术创新和实践应用，帮助学员更好地理解和使用这些模型进行 RAG 开发。

1. **DeepSeek 的架构特点和性能优势**

- 不同规模DeepSeek模型的能力与特点

- DeepSeek-V3 vs DeepSeek-R1

- 原版 671B 和蒸馏版

- 文本、代码生成和推理能力分析

- 对比 GPT-4/Claude 等模型的优势

- 不同场景下的模型选择策略

- RAG 系统中的最佳实践

- 本地部署 vs API 调用的选择

**2. DeepSeek 核心技术创新详解**

- R1 的推理增强型架构设计

- MoE（Mixture of Experts）结构

- 专家路由机制原理

- 动态计算资源分配

- 性能和效率的平衡

- 多头潜在注意力（MLA）

- 注意力机制的改进

- 上下文理解能力提升

- 多令牌预测（MTP）

- 并行生成策略

- 生成效率优化

1. **如何在本机快速部署适合大小的 DeepSeek 模型**

- 不同硬件配置下的部署选择

- 量化方案（4bit/8bit）对比

- 推理加速技术（vLLM/TGI 等）

大模型 RAG 进阶实战营课程大纲

vue基础搭建参考文档

Mybtais核心参考文档资源

TypeScript学习

JDK 源码解析 —— 调试环境搭建（二）进阶

JDK 源码解析 —— 集合（一）数组 ArrayList

Dubbo 源码分析 —— 调试环境搭建