【AI】十五.大模型链路调试平台之LangSmith实战
大模型LLM调用链路分析和LangSmith介绍 需求背景 开发基于大语言模型(LLM)的智能体时,会遇到以下问题: 调试困难 LLM 的输出不可预测,难以追踪中间步骤(如思维链、工具调用)。 错误定位耗时(如工具返回异常,但不知道具体哪一步出错)。
大模型LLM调用链路分析和LangSmith介绍 需求背景 开发基于大语言模型(LLM)的智能体时,会遇到以下问题: 调试困难 LLM 的输出不可预测,难以追踪中间步骤(如思维链、工具调用)。 错误定位耗时(如工具返回异常,但不知道具体哪一步出错)。
大模型Agent智能体介绍和应用场景 什么是智能体Agent 是一种具备自主决策能力的AI系统,通过感知环境、分析信息、调用工具、执行动作的闭环过程完成任务 智能体 = 大语言模型(LLM) + 工具(Tools) + 记忆(Memory)
什么是`Runnable`接口 是LangChain框架中所有组件的核心抽象接口,用于封装可执行的逻辑单元(如模型调用、数据处理、API集成等)
什么是Retriever 统一接口:标准化检索流程,无论数据来源如何,最终输出`Document`对象列表。 多源混合检索:支持同时查询向量库、传统数据库和搜索引擎【提高召回率】
安装 Milvus Python SDK, 支持 Python、Node.js、GO 和 Java SDK。 建议安装与所安装 Milvus 服务器版本相匹配的 PyMilvus 版本
向量数据库介绍和技术选型思考 为什么要用向量数据库,不能用MySQL存储 文档块通过嵌入模型处理后得到对应向量,下一步就是将向量存储到数据库中,方便后续进行检索使用
什么是文本嵌入Text Embedding 文本嵌入(Text Embedding)是将文本(单词、短语、句子或文档)映射到高维向量空间的技术。
向量就是一串有序的数字,像一条带方向的“箭头”, 在机器学习里面尤其重要
RAG系统链路构建之文档切割转换 构建RAG系统:涉及的技术链路环节: 文档加载器->文档转换器->文本嵌入模型->向量存储->检索器
RAG系统链路和数据加载Loaders技术 RAG系统与LLM交互架构图 注意 万丈高楼平地起,基础需要打牢固,一步步进行,然后学会举一反三使用 如果直接讲Agent智能体