RAG | My Little World

RAG 通过给LLM 增加额外/专有知识文档，提高LLM 回答问题的准确性

同一个语义，用词不同，可能导致检索不到有效的结果

解决办法===> 向量检索

向量检索

二维空间中的向量可以表示为(x,y) 表示从原点(0,0) 到点 (x,y) 的有向线段。

以此类推，我可以用一组坐标 (x0，x1,…..xN) 表示一个𝑁 维空间中的向量，𝑁 叫向量的维度。

余弦距离 – 越大越相似

欧氏距离 – 越小越相似

向量数据库，是专门为向量检索设计的中间件

澄清几个关键概念：

划重点：

缺陷

改进: 按一定粒度，部分重叠式的切割文本，使上下文更完整

问题: 有时，最合适的答案不一定排在检索的最前面

方案:

在实际生产中，传统的关键字检索（稀疏表示）与向量检索（稠密表示）各有优劣。

举个具体例子，比如文档中包含很长的专有名词，关键字检索往往更精准而向量检索容易引入概念混淆。

有时候我们需要结合不同的检索算法，来达到比单一检索算法更优的效果。这就是混合检索。

混合检索的核心是，综合文档 𝑑 在不同检索算法下的排序名次（rank），为其生成最终排序。

一个最常用的算法叫 Reciprocal Rank Fusion（RRF）

RAG-Fusion 就是利用了 RRF 的原理来提升检索的准确性。