【AI】九.RAG系统必备之嵌入大模型Embedding
什么是文本嵌入Text Embedding 文本嵌入(Text Embedding)是将文本(单词、短语、句子或文档)映射到高维向量空间的技术。
什么是文本嵌入Text Embedding 文本嵌入(Text Embedding)是将文本(单词、短语、句子或文档)映射到高维向量空间的技术。
向量就是一串有序的数字,像一条带方向的“箭头”, 在机器学习里面尤其重要
RAG系统链路构建之文档切割转换 构建RAG系统:涉及的技术链路环节: 文档加载器->文档转换器->文本嵌入模型->向量存储->检索器
RAG系统链路和数据加载Loaders技术 RAG系统与LLM交互架构图 注意 万丈高楼平地起,基础需要打牢固,一步步进行,然后学会举一反三使用 如果直接讲Agent智能体
“幻觉输出”(Hallucination)是大语言模型(如GPT、Llama、DeepSeek等)生成内容时的一种常见问题. 指模型输出看似合理但实际错误、虚构或脱离事实的信息。
Pydantic 是一个在 Python 中用于数据验证和解析的第三方库,是 Python 使用最广泛的数据验证库 声明式的方式定义数据模型和,结合Python 类型提示的强大功能来执行数据验证和序列化
什么是Chain链 是构建语言模型应用的核心组件,用于将多个模块(如模型调用、提示模板、记忆系统等)组合成可复用的工作流程。
什么是Prompt Engineering提示词工程 通过特定格式的文本输入引导AI模型生成期望输出的技术,明确地告诉模型你想要解决的问题或完成的任务 也是大语言模型理解用户需求并生成相关、准确回答或内容的基础
背景需求 大模型(如ChatGPT、DeepSeek)的局限性: 1.无法获取训练数据外的实时信息(如今天的天气) 2.不能直接执行具体操作(发邮件/查数据库) 3.处理复杂任务时缺乏步骤规划能力
课程介绍 - AI智能化云盘大课:后端分布式大项目+结合AI大模型智能体开发+业务应用 - 众多新技术+后端业务领域超多解决方案+AI大模型多案例应用场景落地 - 多语言开发:云盘板块采用Java开发后端项目,AI智能化板块采用Python+LangChain框架+大模型开发;