一、 RAG 有什么用

RAG 可以解决通用大模型存在的问题

通用的基础大模型的局限性

知识的局限性

幻觉问题

数据安全性

二、 RAG 是什么

概念

检索

增强

生成

三、 RAG 的工作原理

创建外部数据

检索相关信息

增强 LLM 提示

更新外部数据

四、 RAG 的工作流程

数据准备

数据提取

数据加载
数据处理
元数据获取

文本分割

分割原因
分割方法

向量化

简要介绍
为什么要做嵌入
什么是文本嵌入
创建索引

数据入库

简要介绍
存储方式

应用阶段

数据检索

简要介绍
检索步骤
检索方法

注入 prompt

简要介绍
举例说明

生成

简要介绍

五、 RAG 的体系结构

简要介绍

检索器模块

生成器模块

融合机制

六、 RAG 的类型

开放域问题解答

特定领域的专用查询

内容摘要

个性化推荐

复杂场景分析和内容制作

研究信息和合成

多语言和跨语言应用

参考

https://zhuanlan.zhihu.com/p/668082024
https://blog.csdn.net/m0_70486148/article/details/144883208
https://cloud.tencent.com/developer/article/2373282
https://aws.amazon.com/cn/what-is/retrieval-augmented-generation/
https://blog.csdn.net/2401_82452722/article/details/135934144
https://azure.microsoft.com/zh-cn/resources/cloud-computing-dictionary/what-is-retrieval-augmented-generation-rag


↙↙↙阅读原文可查看相关链接,并与作者交流