Anthropic 发布了一种可以大幅增加 RAG 检索准确性的方案。
Contextual Retrieval embeddings + contextual BM25,检索失败几率降低 49%。
主要方法是:
使用 Claude 为每个文本片段生成上下文。具体做法是将文本片段和整个文档一起输入给 Claude。
在进行嵌入 处理之前,先将生成的上下文添加到每个文本片段的前面。
在检索步骤中,结合使用上下文嵌入和上下文 BM25 技术。
需要配合提示缓存来使用,不然会消耗大量 Token。
详细信息:https://www.anthropic.com/news/contextual-retrieval
