在一个典型的RAG应用开发中,必要的步骤为文档加载,文档拆分,向量化,向量存储。然后基于向量存储进行相似性查询,或基于向量距离的查询。这类查询就叫检索,LangChain所提供的对应组件就是检索器。
但这种方式在查询语句发生微小变化时可能就会带来不同的结果。LangChain则提供了一系列更高级的检索实现,帮助开发者解决这类问题,或提高检索质量。
参考视频
多向量检索器
今天我们介绍第4种,MultiVector Retriever(多向量检索器)。通常它实现方式包括:
-
Smaller Chunks
-
Summary
-
Hypothetical Questions