启用 Excel2HTML (Enable Excel2HTML)
将复杂的 Excel 电子表格转换为 HTML 表格。
使用 通用 (General) 分块 (Chunking) 方法时,你可以启用 Excel 转 HTML (Excel to HTML) 开关,将电子表格文件转换为 HTML 表格。如果禁用此功能,电子表格将表示为键值对。对于无法简单通过这种方式表示的复杂表格,你必须启用此功能。
警告 (WARNING)
该功能默认禁用。如果你的数据集中包含带有复杂表格的电子表格,且你未启用此功能,RAGFlow 不会报错,但你的表格很可能会出现内容错乱或解析不佳的情况。
适用场景 (Scenarios)
适用于无法用键值对表示的复杂表格。例如,包含多列的电子表格、合并单元格的表格,或者一个工作表 (Sheet) 中包含多个表格。在这种情况下,建议将这些电子表格转换为 HTML 表格。
注意事项 (Considerations)
- Excel2HTML 功能仅适用于电子表格文件(XLSX 或 XLS (Excel 97-2003))。
- 此功能与 通用 (General) 分块方法相关联。换句话说,只有在你选择 通用 分块方法时,它才可用。
- 启用此功能后,超过 12 行的电子表格将被拆分为每个包含 12 行的块。
操作步骤 (Procedure)
-
在数据集 (Dataset) 的 配置 页面上,选择 通用 (General) 作为分块方法。
随后将出现 Excel 转 HTML (Excel to HTML) 开关。
-
如果你的数据集中包含无法用键值对表示的复杂电子表格,请启用 Excel 转 HTML。
-
如果你的数据集中没有电子表格,或者其电子表格可以用键值对表示,请保持 Excel 转 HTML 处于禁用状态。
-
如果关于复杂表格的问答效果不理想,请检查是否已启用 Excel 转 HTML。
常见问题 (Frequently asked questions)
我应该为包含复杂表格的 PDF 启用此功能吗?
不需要。此功能仅适用于电子表格文件。启用 Excel 转 HTML 不会影响你的 PDF 文件。