项目
博客
归档
资源链接
关于我
项目
博客
归档
资源链接
关于我
大模型 RAG 进阶实战营课程大纲
2025-07-25
·
·
转载
·
AI大模型
·
本文共 1,121个字,预计阅读需要 4分钟。
本训练营是一个面向实战的 RAG 开发课程,将带领学员从零开始构建企业级 RAG 应用。 ### 课程特色 1. **实战导向**:通过 4 个真实项目案例,覆盖金融、医疗、企业合规等多个领域的 RAG 应用场景。 2. **DeepSeek 助力开发**: - 使用 DeepSeek 开源大模型进行 RAG 系统开发 - 利用 DeepSeek 强大的推理、代码理解和生成能力,加速开发过程 - 支持中英双语开发,适合国内开发场景 3. **Cursor 智能编程**: - 使用 Cursor 作为主要 IDE 工具 - 实时 AI 编程助手,提供代码补全和优化建议 - 快速调试和问题诊断能力 4. **完整技术栈**: - 从数据处理到系统部署的全流程实践 - 11 节核心技术详解,深入 RAG 各个环节 - 前沿技术探索,包括 GraphRAG、Agentic RAG 等最新进展 通过 DeepSeek + Cursor 的协同,学员将体验到 AI 辅助下的高效 RAG 开发流程,快速掌握 RAG 系统的搭建与优化技巧。 ### 准备篇 安装最新版 Cursor 并配置 DeepSeek 等大模型 **说明**: 指导安装最新版 Cursor,并配置最新的大模型(如 DeepSeek-V3、DeepSeek-R1、GPT-4o、Claude-3.5 Sonnet 等),实现高效的 AI 开发环境。此外,还将涵盖 RAG 相关工具的配置,助力智能检索与内容生成任务。 **详细内容** 1. **安装最新版 Cursor** - 介绍 Cursor 的特点及其对 AI 编程的优化 - 下载安装最新版本的 Cursor - 配置适用于大模型开发的环境与插件 2. **配置 DeepSeek 等大模型** - 安装并配置 DeepSeek-V3、DeepSeek-R1 - 介绍 GPT-4o/DeepSeek-V3/DeepSeek-R1 的区别及适用场景 - 配置 API 调用,支持在 Cursor 内无缝切换不同模型 ### 第一部分:RAG 基础和 RAG 真实落地项目实战 #### 第一课 RAG 三问 **说明**:通过三个问题,快速了解 RAG 的核心概念、应用场景和优化方向,为后续学习打下基础。 1. 掌握 RAG 的基本概念和整体框架 2. 了解 RAG 的典型应用场景和优势 3. 明确 RAG 系统的关键优化方向和步骤 ##### 详细内容 1. **RAG 的整体框架和技术组件是什么?** - 详解 RAG 的三个核心组成部分:文档读取、检索和生成 - 10 大核心组件:文档导入、文本分块、嵌入、向量存储、查询优化、检索、检索后处理、生成、评估、整体流程优化 - RAG 的完整流程,并讲解每个环节的作用和意义 2. **如何快速搭建 RAG 系统?** - 使用 LlamaIndex 和 LangChain 快速搭建 RAG 系统(在 GPT-o1/DeepSeek-V3/R1 等最新大模型间任意切换) - 不使用框架,直接用嵌入模型、向量数据库和 LLM 搭建 RAG 系统 - 使用 Coze、Dify 和 Ragflow 等可视化工具搭建 RAG 系统 3. **从何处入手优化 RAG 系统?** - 分块策略:不同粒度对检索效率和准确度的影响 - 嵌入策略:如何选择合适的嵌入模型和向量数据库 - 检索策略:关键词检索、语义检索和混合检索的优缺点 - 生成策略:如何控制生成内容的质量和相关性 - 评估体系:如何评估 RAG 系统的性能和效果 #### 第二课 实战项目-1:构建自己的 RAG 前端和后端框架 **说明**:本课及后续几个项目实战旨在让学员快速搭建完整项目,搭建起基于本地知识库的企业问答系统,并初步运行 RAG 系统。后续章节的核心技术详解篇仍将基于这些项目逐步优化 RAG 系统,并在过程中逐步深化对 RAG 各个组件的理解。 **项目目标:** - 掌握 RAG 前端框架的设计和开发 - 学习如何与后端 RAG 系统进行交互 - 实现用户友好的界面和交互体验 - 自己搭建框架,便于评估,调试 - 自主配置各种 RAG Pipeline, 文档解析器,嵌入模型和生成模型 **项目内容:** - 设计前端界面,包括用户输入、结果展示、交互功能等 - 使用 JavaScript、HTML、CSS 等技术实现前端框架 - 与后端 RAG 系统进行 API 对接,实现数据传输和交互 - 优化前端性能,提升用户体验 #### 第三课 实战项目-2:金融/医疗领域专有词汇标准化系统开发 **说明**:金融/医疗领域有自己的特定术语系统,如何在金融(或医疗)文档中识别这些术语,并进行标准化处理,可以节省从业人员的时间成本,提升工作效率,同时提高文档的专业程度。 **项目目标:** - 掌握金融/科技专有词汇标准化系统的开发 - 学习如何处理金融/医疗领域的专业术语,将非标准化术语通过 RAG 和检索系统进行标准化,以及缩略语的自动扩写 - 构建一个可以对专有词汇进行标准化的 RAG 系统 **项目内容:** - 收集整理银行/医疗领域的专有词汇和相关文档 - 构建 RAG 系统,实现对专有词汇的识别和标准化 #### 第四课 实战项目-3:企业文档合规性检索和问答系统开发 **说明**:企业文档合规性检索和问答系统开发,通过 RAG 系统帮助企业进行合规性审查,提升工作效率,同时降低合规风险。 **项目目标:** - 掌握企业文档合规性检索和问答系统的开发 - 学习如何处理法律法规、行业标准等文档 - 构建一个可以帮助企业进行合规性审查的 RAG 系统 **项目内容:** - 收集整理企业内部文档和相关法律法规、行业标准等 - 对文档进行预处理,包括分词、实体识别等 - 构建 RAG 系统,实现对文档的检索和问答功能 - 尝试 BM25、Naive RAG、混合检索等多种算法 - 对系统进行评估和优化,提升准确性和效率 #### 第五课 实战项目-4:基于 GraphRAG、LightRAG 和 LazyGraphRAG 的知识图谱 RAG 系统构建 **说明**:近年来,知识图谱在企业 RAG 系统中得到了越来越广泛的应用,本项目将实现医学领域的医疗术语的知识图谱的构建和可视化,同时可以进行知识推理和问答。 **项目目标:** - 掌握基于图的 RAG 系统的构建 - 学习 GraphRAG、LightRAG 和 LazyGraphRAG 等方法 - 构建一个可以进行知识推理和问答的 RAG 系统 **项目内容:** - 收集整理知识图谱数据 - 基于知识图谱构建 RAG 系统 ## 第二部分:RAG 各组件与核心技术详细拆解 ## 第一课:数据导入技术 ### 教学目标: 掌握从不同来源导入数据的技巧,包括文本、表格、图像、网页等,为 RAG 系统提供丰富的数据支持。 1. 学会使用不同的数据加载器读取各种格式的文档,尤其是复杂 PDF 的解析方式 1. 掌握处理图像和网页数据的技巧 1. 了解如何保留文档的结构化信息 ### 详细内容: 1. 简单文本的读取: 1. 使用 LangChain 和 LlamaIndex 读取 txt 文档 1. 各种主要文档加载器的介绍和使用 1. 表格数据的导入: 1. 使用 Unstructured 处理 CSV 数据 1. 自动形成和手动指定元数据 1. PDF 图像\表格和网页数据的处理: 1. 使用 OCR 技术识别图像中的文字 1. 利用 LLM 解析图文信息 1. 爬取网页数据并进行解析 **实战**:重构实战项目 1 和 3 中的数据导入部分。 ## 第二课:文本分块技术 ### 教学目标: 理解文本分块的重要性,掌握不同的分块策略,并学习如何优化分块效果。 1. 理解分块对 RAG 系统的影响 1. 掌握按大小、格式和语义进行分块的技巧 1. 学习如何为文本块添加元数据 ### 详细内容: 1. 分块的重要性: 1. 影响检索效率和准确度 1. 避免 LLM 的上下文窗口限制 1. 不同的分块策略: 1. 按大小分块:固定长度、滑动窗口等 1. 按格式分块:段落、课节等 1. 按语义分块:主题、实体等 1. 高级分块技巧: 1. 使用 Tiktoken 计算 Token 数量 1. 为文本块添加元数据 1. 构建多层次索引 **实战**:重构实战项目 1 和 3 中的文本分块部分。 ## 第三课:嵌入技术 ### 教学目标: 了解嵌入模型的原理,掌握不同嵌入模型的特点,并学习如何选择合适的嵌入模型。 1. 掌握嵌入模型的基本概念和作用 1. 了解不同嵌入模型的优缺点和适用场景 1. 学习如何评估嵌入模型的效果 ### 详细内容: 1. 嵌入模型的原理: 1. 将文本转换为向量表示。 1. 捕捉文本的语义信息。 1. 不同嵌入模型的特点: 1. 商用模型:OpenAI、Cohere、VoyageAI 等 1. 开源模型:BGE、Sentence Transformer 等 1. 实战案例:使用 OpenAI 嵌入模型进行文本聚类 1. 嵌入模型的评估和选择: 1. MTEB 基准测试 1. 稀疏嵌入和密集嵌入 1. 重排序模型 **实战**:重构实战项目 1、2、3 中的嵌入部分。 ## 第四课:向量存储和索引技术 ### 教学目标: 掌握向量数据库的工作原理,了解不同向量数据库的特点,并学习如何选择和使用向量数据库。 不同索引的区别、维度区别、如何加速索引,Query 和 Search 的区别和组合。 1. 理解向量数据库的基本概念和作用 1. 了解不同向量数据库的优缺点和适用场景 1. 学习如何优化向量数据库的性能 ### 详细内容: 1. 向量数据库的工作原理: 1. 存储和检索文本向量 1. 加速语义检索 1. 不同向量数据库的特点: 1. Milvus、Weaviate、Qdrant 等 1. 索引和搜索设置 1. 实战案例:使用 Milvus 构建 RAG 系统 1. 向量数据库的高级应用: 1. 混合嵌入和混合检索(稀疏检索 + 密集检索/BM25 + ANN 相似度检索) 1. 多模态检索 **实战**:重构实战项目 1、2、3、4 中的向量存储部分。 ## 第五课:预检索-查询优化技术 ### 教学目标: 学习如何优化查询语句,提高检索效率和准确度。 1. 掌握查询重写、分解和澄清的技巧 1. 了解查询路由和扩展的应用 ### 详细内容: 1. 查询构建(Query Rewriting): 1. Text-to-SQL:将自然语言转换为 SQL 语句 1. Text-to-Cypher:适配图数据库的查询转换 1. Self-query Retriever:自动从查询中提取结构化信息 1. 查询优化(Query Translation): 1. 查询重写(Query Rewriting):使用 LLM 优化查询语句改写原始查询以提高准确性 1. 查询分解(Query Decomposition):将复杂查询拆分为多个子查询 1. 查询澄清(Query Clarification):通过交互明确用户意图 1. 查询扩展 - HyDE:生成假设文档来增强查询效果 1. 查询路由: 1. 语义路由:根据查询内容选择合适的知识库 1. 定义路由:基于预设规则进行查询分发 **实战**:重构实战项目 1、2、3、4 中的查询优化部分。 ## 第六课:提升检索准确性的方法 ### 教学目标: 学习如何优化检索策略,包括索引结构、检索算法和结果排序等, 讲解如何利用多路知识来源,以及上下文窗口过大的处理等。 1. 掌握不同的检索策略和技巧 1. 学习如何处理各种检索问题 ### 详细内容: 1. 检索策略: 1. 从小到大:节点-句子滑动窗口技术 1. 粗中有细:RecursiveRetriever 构建多层次索引 1. 分层合并:组合相关节点 1. 混合查询:结合关键词检索和语义检索 1. 检索问题和解决方法: 1. 关键文档未被检索到 1. 关键文档排名过低 1. 检索结果不够全面或过于宽泛 1. 检索结果过于冗长 **实战**:重构实战项目 1、2、3、4 中的检索部分。 ## 第七课:检索后处理技术 ### 教学目标: 学习如何对检索结果进行后处理,包括重排、压缩和校正等,进一步提高 RAG 系统的性能。 1. 掌握不同的检索后处理技术 1. 了解各种后处理技术的优缺点和适用场景 ### 详细内容: 1. 重排: 1. 根据语义相似度、时效等因素对检索结果重新排序 1. RRF、CrossEncoder Reranking 等方法 1. 压缩: 1. 精简检索结果,避免 LLM 的上下文窗口限制 1. LLMLingua、RECOMP 等方法 1. 校正: 1. 纠正检索结果中的错误和偏差 1. Corrective RAG 等方法 **实战**:重构实战项目 1、2、3、4 中的检索后处理部分。 ## 第八课:生成过程中的技术 ### 教学目标: 学习如何优化生成过程,包括提示设计、结果规范化和内容控制等,从而提高 RAG 系统的输出质量。 1. 掌握不同的生成优化技术 1. 了解如何将检索结果融入生成过程 ### 详细内容: 1. 提示设计: 1. 规范化生成结果 1. 控制生成内容的准确性和多样性 1. 检索结果集成方式: 1. 输入层集成、输出层集成和中间层集成 1. 高级生成技术: 1. Self-RAG:自我反思式生成 1. RRR:动态生成优化 **实战**:重构实战项目 1、2、3、4 中的生成部分。 ## 第九课:评估检索结果的技术 ### 教学目标: 学习如何评估 RAG 系统的性能,包括检索评估和响应评估,并掌握不同的评估指标和框架。 1. 了解 RAG 系统的评估体系 1. 掌握不同的评估指标和框架 1. 学习如何利用评估结果优化 RAG 系统 ### 详细内容: 1. 评估指标: 1. 检索评估:精确率、召回率、F1 值等 1. 响应评估:语义相似度、忠实度等 1. 评估框架: 1. RAGAS、Phoenix、TruLens 等 1. 评估结果的应用: 1. 优化分块策略、嵌入模型、检索算法等 1. 构建高性能 RAG 系统 **实战**:可以通过本课内容,重构实战项目 1、2、3、4 中的评估部分。 ## 第十课:复杂检索策略和范式 ### 教学目标: 了解 RAG 的高级应用和未来发展趋势,包括图检索、多模态检索、迭代式检索等。 1. 掌握 GraphRAG、Contextual Retrieval 等高级检索技术 1. 了解多模态 RAG、Agentic-RAG 等前沿研究方向 ### 详细内容: 1. GraphRAG: 1. 利用图结构增强语义检索 1. 构建知识图谱,实现更精准的知识问答 1. Contextual Retrieval: 1. 基于上下文和多轮对话的高级检索策略 1. 实现对结构化数据的精准检索 1. 多模态 RAG: 1. 融合图像、视频等多模态信息 1. 实现更全面的信息检索和理解 1. Agentic-RAG: 1. 基于 Agent 的检索和生成策略 1. Agent 作为检索控制器,实现更智能的检索和生成 1. 动态检索路径(Dynamic Retrieval Planning) ## 第十一课:其他工具、论文和开源项目 ### 教学目标: RAG 领域的前沿进展,拓展 RAG 领域的知识和视野,了解更多的工具、论文和开源项目。 ### 详细内容: 1. Modular RAG: 1. 构建可插拔的 RAG 系统 1. 提高系统的灵活性和可扩展性 1. RAG + Fine-tuning: 1. 结合 RAG 和微调技术 1. 进一步提高 LLM 的性能 1. RAG 相关论文和开源项目: 1. 同济大学综述论文:Retrieval-Augmented Generation for Large Language Models: A Survey 1. 香港理工大学综述:A Survey on RAG Meeting LLMs: Towards Retrieval-Augmented Large Language Models 1. LightRAG、StructRAG、LazyGraphRAG、Agentic-RAG 等最新进展 ## 加餐篇 DeepSeek-V3 及 DeepSeek-R1 技术详解 **说明**:介绍 DeepSeek 系列模型的技术创新和实践应用,帮助学员更好地理解和使用这些模型进行 RAG 开发。 1. **DeepSeek 的架构特点和性能优势** - 不同规模DeepSeek模型的能力与特点 - DeepSeek-V3 vs DeepSeek-R1 - 原版 671B 和蒸馏版 - 文本、代码生成和推理能力分析 - 对比 GPT-4/Claude 等模型的优势 - 不同场景下的模型选择策略 - RAG 系统中的最佳实践 - 本地部署 vs API 调用的选择 **2. DeepSeek 核心技术创新详解** - R1 的推理增强型架构设计 - MoE(Mixture of Experts)结构 - 专家路由机制原理 - 动态计算资源分配 - 性能和效率的平衡 - 多头潜在注意力(MLA) - 注意力机制的改进 - 上下文理解能力提升 - 多令牌预测(MTP) - 并行生成策略 - 生成效率优化 1. **如何在本机快速部署适合大小的 DeepSeek 模型** - 不同硬件配置下的部署选择 - 量化方案(4bit/8bit)对比 - 推理加速技术(vLLM/TGI 等)