跳到主要内容

设置上下文窗口大小 (Set context window size)

设置图像和表格的上下文窗口大小,以提高长上下文检索增强生成 (Retrieval-Augmented Generation, RAG) 的性能。


RAGFlow 利用内置的 DeepDoc 以及 MinerU 和 Docling 等外部文档模型来解析文档布局。在以前的版本中,基于文档布局提取的图像和表格被视为独立的文本块 (Chunk)。因此,如果搜索查询没有直接匹配图像或表格的内容,这些元素就无法被检索出来。然而,现实世界中的文档经常将图表和表格与周围的文本交织在一起,而周围的文本通常是对它们的描述。因此,基于这种上下文文本召回图表是一项非常关键的能力。

为了解决这个问题,RAGFlow 0.23.0 引入了 图像和表格上下文窗口 (Image & table context window) 功能。该功能的设计灵感来自专注于研究的开源多模态 RAG 项目 RAG-Anything 的核心理念,它允许根据用户可配置的窗口大小将周围的文本和相邻的视觉元素分组到单个块中。这确保了它们能够被一起检索,从而显著提高了图表和表格的召回准确率。

操作步骤 (Procedure)

  1. 在数据集 (Dataset) 的 配置 页面上,找到 图像和表格上下文窗口 (Image & table context window) 滑块:

  1. 根据你的需要调整上下文 Token 的数量。

    红框中的数字表示将捕获图像/表格上方和下方大约 N 个 Token 的文本,并将其作为上下文信息插入到图像或表格块中。捕获过程会智能地在标点符号处优化边界,以保持语义完整性。