跳到主要内容

Indexer 组件 (Indexer Component)

该组件用于定义如何对分块 (Chunks) 进行索引。


Indexer (索引器) 组件对分块进行索引,并配置它们在文档引擎中的存储格式。

适用场景 (Scenario)

Indexer 组件是所有数据解析入库流水线中必须具有的末端组件。

配置项 (Configurations)

Search method (检索方法)

此设置配置了分块在文档引擎中的存储方式:全文检索 (Full-text)、向量检索 (Embedding) 或混合检索 (Both)。

Filename embedding weight (文件名嵌入权重)

此设置定义了文件名对最终嵌入 (Embedding) 的贡献比例,最终嵌入是分块内容和文件名的加权组合。本质上,较高的值会使文件名在最终的复合嵌入中产生更大的影响。

  • 0.1:文件名贡献占 10%(分块内容占 90%)
  • 0.5(最大值):文件名贡献占 50%(分块内容占 50%)