文档摘要索引 | 人工智能开发者中心

【QA系统】LLM驱动的QA系统的一种新的文档摘要索引

developer.chat

10 May 2023

在这篇博客文章中，我们介绍了一种全新的LlamaIndex数据结构：文档摘要索引。我们描述了与传统的语义搜索相比，它如何有助于提供更好的检索性能，并举例说明。

出身背景

大型语言模型（LLM）的核心用例之一是对自己的数据进行问答。为此，我们将LLM与“检索”模型配对，该模型可以在知识语料库上执行信息检索，并使用LLM对检索到的文本执行响应合成。这个整体框架被称为检索增强生成。

如今，大多数构建LLM支持的QA系统的用户倾向于执行以下某种形式的操作：

获取源文档，将每个文档拆分为文本块
将文本块存储在矢量数据库中
在查询期间，通过嵌入相似性和/或关键字过滤器来检索文本块。
执行响应合成

由于各种原因，这种方法提供的检索性能有限。

订阅文档摘要索引

↑