Indexer 组件 (Indexer Component)
该组件用于定义如何对分块 (Chunks) 进行索引。
Indexer (索引器) 组件对分块进行索引,并配置它们在文档引擎中的存储格式。
适用场景 (Scenario)
Indexer 组件是所有数据解析入库流水线中必须具有的末端组件。
配置项 (Configurations)
Search method (检索方法)
此设置配置了分块在文档引擎中的存储方式:全文检索 (Full-text)、向量检索 (Embedding) 或混合检索 (Both)。
Filename embedding weight (文件名嵌入权重)
此设置定义了文件名对最终嵌入 (Embedding) 的贡献比例,最终嵌入是分块内容和文件名的加权组合。本质上,较高的值会使文件名在最终的复合嵌入中产生更大的影响。
- 0.1:文件名贡献占 10%(分块内容占 90%)
- 0.5(最大值):文件名贡献占 50%(分块内容占 50%)