跳到主要内容

管理元数据 (Manage metadata)

管理你的数据集和单个文档的元数据。


从 v0.23.0 版本开始,RAGFlow 允许你在数据集 (Dataset) 级别和单个文件级别管理元数据 (Metadata)。

操作步骤 (Procedure)

  1. 点击数据集内的 元数据 (Metadata) 以访问 管理元数据 (Manage Metadata) 页面。

  1. 管理元数据 页面上,你可以执行以下任一操作:

    • 编辑值 (Edit Values):你可以修改现有值。如果你将两个值重命名为完全相同的值,它们将被自动合并。
    • 删除 (Delete):你可以删除特定的值或整个字段。这些更改将应用于所有相关联的文件。

    配置自动生成元数据规则的页面将会出现。

  1. 要管理单个文件的元数据,请导航到如下所示的文件详情页面。点击解析方法(例如 通用 (General)),然后选择 设置元数据 (Set Metadata) 以查看或编辑该文件的元数据。在这里,你可以添加、删除或修改该特定文件的元数据字段。在此处所做的任何修改都将反映在知识库主元数据管理页面的全局统计数据中。

  1. 过滤功能在两个层面上运行:知识库管理和检索。在数据集中,点击 过滤 按钮可以查看现有元数据字段下与每个值相关联的文件数量。通过选择特定值,你可以显示所有链接的文件。

  1. 在检索阶段也支持元数据过滤。例如,在聊天 (Chat) 中,你可以在配置知识库 (Knowledge Base) 后设置元数据过滤规则:

  • 自动 (Automatic) 模式:系统根据用户的查询和知识库中现有的元数据自动过滤文档。
  • 半自动 (Semi-automatic) 模式:用户首先在字段级别定义过滤范围(例如针对 作者 (Author)),然后系统在该预设范围内自动进行过滤。
  • 手动 (Manual) 模式:用户手动设置精确的、特定值的过滤条件,支持 等于 (Equals)不等于 (Not equals)包含于 (In)不包含于 (Not in) 等操作符。