跳到主要内容

启用 Excel2HTML (Enable Excel2HTML)

将复杂的 Excel 电子表格转换为 HTML 表格。


使用 通用 (General) 分块 (Chunking) 方法时,你可以启用 Excel 转 HTML (Excel to HTML) 开关,将电子表格文件转换为 HTML 表格。如果禁用此功能,电子表格将表示为键值对。对于无法简单通过这种方式表示的复杂表格,你必须启用此功能。

警告 (WARNING)

该功能默认禁用。如果你的数据集中包含带有复杂表格的电子表格,且你未启用此功能,RAGFlow 不会报错,但你的表格很可能会出现内容错乱或解析不佳的情况。

适用场景 (Scenarios)

适用于无法用键值对表示的复杂表格。例如,包含多列的电子表格、合并单元格的表格,或者一个工作表 (Sheet) 中包含多个表格。在这种情况下,建议将这些电子表格转换为 HTML 表格。

注意事项 (Considerations)

  • Excel2HTML 功能仅适用于电子表格文件(XLSX 或 XLS (Excel 97-2003))。
  • 此功能与 通用 (General) 分块方法相关联。换句话说,只有在你选择 通用 分块方法时,它才可用。
  • 启用此功能后,超过 12 行的电子表格将被拆分为每个包含 12 行的块。

操作步骤 (Procedure)

  1. 在数据集 (Dataset) 的 配置 页面上,选择 通用 (General) 作为分块方法。

    随后将出现 Excel 转 HTML (Excel to HTML) 开关。

  2. 如果你的数据集中包含无法用键值对表示的复杂电子表格,请启用 Excel 转 HTML

  3. 如果你的数据集中没有电子表格,或者其电子表格可以用键值对表示,请保持 Excel 转 HTML 处于禁用状态。

  4. 如果关于复杂表格的问答效果不理想,请检查是否已启用 Excel 转 HTML

常见问题 (Frequently asked questions)

我应该为包含复杂表格的 PDF 启用此功能吗?

不需要。此功能仅适用于电子表格文件。启用 Excel 转 HTML 不会影响你的 PDF 文件。