版本发布记录 (Releases)
最新版本中的关键特性、改进和缺陷修复。
v0.25.2
2026 年 5 月 11 日发布。
改进 (Improvements)
- API 重构与统一:持续将 Web API 转换到 RESTful 规范,确保所有历史端点的向后兼容性。
数据源 (Data source)
缺陷修复 (Bug fixes)
- 修复了在从 v0.24.0 升级至 v0.25.0 期间元数据可见性损坏的问题。
- 修复了重复的对话输出问题。
- 修复了在内存中处理元数据过滤而不是利用 Elasticsearch,从而导致性能瓶颈的问题。 #14576
v0.25.1
2026 年 4 月 29 日发布。
改进 (Improvements)
- API 重构与统一:在所有端点上将 Web API 标准化为 RESTful 规范,统一文档创建和索引流程,同时保持向后兼容性。
- 解析优化:新增 OpenDataLoader PDF 解析器后端。 #14097
- 针对大型 PDF(超过 50 页)引入了惰性加载和分块解析,显著减少了内存占用。 #14385
数据源 (Data source)
支持在 Bitbucket、Gmail、Google Drive 和 Airtable 中同步已删除的文件。 #14362
模型支持 (Model support)
- DeepSeek v4
模型提供商 (Model providers)
- UCloud
缺陷修复 (Bug fixes)
- 修复了在从 v0.24.0 升级至 v0.25.0 期间元数据可见性损坏的问题。
- 修复了重复的对话输出问题。
v0.25.0
2026 年 4 月 21 日发布。
新特性 (New features)
- 智能体 (Agent)
- 引入了七个预置的解析流水线 (Ingestion Pipeline) 模板。
- 支持发布智能体应用。
- 支持沙箱代码执行与图表生成。
- 新增初学者数据分析智能体模板。
- 记忆 (Memory):支持用户级的记忆存储与检索。
- 新增 UI 语言:阿拉伯语(实现了从右到左的 RTL 布局)、保加利亚语和土耳其语。
- 生态系统集成:支持通过 OpenClaw 访问 RAGFlow 知识库/数据集。
改进 (Improvements)
- 通过支持图像惰性加载优化了 Docx 解析,降低了内存占用。
- 优化了对话、智能体和搜索的嵌入式对话页面,以适配移动端兼容性。
- 底层系统与基础设施优化:
- 将 RAGFlow 的文档引擎 Elasticsearch 升级至 9.x。
- 鉴于官方 MinIO 镜像已被弃用,将默认的对象存储容器切换为
pgsty/minio。 - 新增数据库迁移脚本;详情请参阅此自述文件。
模型支持 (Model support)
- MiniMax-M2.7 系列
- Perplexity 嵌入模型 (pplx-embed)
- 通义重排 (Rerank) 模型
新模型提供商 (New model providers)
- avian.io
- ragcon.ai
数据源 (Data sources)
- Seafile
- RSS
- 钉钉 AI 多维表 (DingTalk AI Table)
- GitHub:支持同步已删除的文件。
v0.24.0
2026 年 2 月 10 日发布。
新特性 (New features)
- 记忆 (Memory)
- 引入了记忆管理 API(HTTP 和 Python)。
- 在控制台输出记忆提取日志。
- 知识库 (Dataset)
- 支持批量元数据管理。
- 将 "ToC (目录大纲)" 重命名为 "PageIndex"。参见此处。
- 智能体 (Agent)
- 推出全新的类似于对话的智能体对话管理界面,可保留会话和对话历史。
- 引入了支持本地 gVisor 和阿里云的多沙箱 (Sandbox) 机制,并兼容主流的沙箱 API(可在管理后台页面配置)。
- 对话 (Chat)
- 新增全新的“深度思考 (Thinking)”模式,并移除了以前的“推理 (Reasoning)”配置选项。
- 针对深度研究 (Deep Research) 场景优化了检索策略,提升了召回率。
- 系统管理 (Admin)
- 支持多个管理员账户。
- 模型配置中心
- 针对新引入的模型增加了模型连接测试功能。
MySQL 替代方案 (MySQL alternative)
- 支持 OceanBase 作为 MySQL 的替代数据库。
模型支持 (Model support)
- Kimi 2.5
- 阶跃星辰 (Stepfun) 3
- 字节跳动豆包视觉嵌入模型 (doubao-embedding-vision)
- PaddleOCR-VL
数据源 (Data sources)
- Zendesk
- Bitbucket
API 变更 (API changes)
HTTP API
Python API
v0.23.1
2025 年 12 月 31 日发布。
改进 (Improvements)
- 记忆 (Memory):在选择所有记忆类型时,增强了记忆提取的稳定性。
- 检索增强生成 (RAG):优化了针对图像和表格的上下文窗口提取策略。
已修复问题 (Fixed issues)
- 记忆 (Memory):
- 修复了存在空记忆对象时 RAGFlow 服务器启动失败的问题。
- 修复了无法删除新创建的空记忆的问题。
- 检索增强生成 (RAG):此前不支持 MDX 文件解析的问题已修复。
数据源 (Data sources)
- GitHub
- GitLab
- Asana
- IMAP
v0.23.0
2025 年 12 月 27 日发布。
新特性 (New features)
- 记忆 (Memory)
- 实现了用于管理记忆的 Memory(记忆)界面。
- 支持通过 Retrieval(检索)或 Message(消息)组件配置上下文。
- 智能体 (Agent)
- 通过重构底层架构,提升了 Agent(智能体)组件的性能。
- Agent 组件现在可以输出结构化数据,以供下游组件使用。
- 支持使用 Webhook 来触发智能体的执行。
- 支持语音输入/输出。
- 支持在单个 Agent 组件中配置多个 Retrieval 组件。
- 解析流水线 (Ingestion pipeline)
- 支持在 Transformer 组件中提取目录大纲,以改善长上下文 RAG 的性能。
- 知识库 (Dataset)
- 支持为图像和表格配置上下文窗口。
- 引入了父子分块 (parent-child chunking) 策略。
- 支持在文件解析过程中自动生成元数据。
- 对话 (Chat):支持语音输入。
改进 (Improvements)
- RAG:显著加快了 GraphRAG 的生成速度。
- 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.15(向后兼容)。
数据源 (Data sources)
- Google Cloud Storage
- Gmail
- Dropbox
- WebDAV
- Airtable
模型支持 (Model support)
- GPT-5.2
- GPT-5.2 Pro
- GPT-5.1
- GPT-5.1 Instant
- Claude Opus 4.5
- MiniMax M2
- GLM-4.7
- 提供了 MinerU 配置界面。
- 支持新模型提供商 AI Badgr。
API 变更 (API changes)
HTTP API
v0.22.1
2025 年 11 月 19 日发布。
改进 (Improvements)
- 智能体 (Agent):
- 支持将智能体输出导出为 Word 或 Markdown 格式。
- 新增 List operations(列表操作)组件。
- 新增 Variable aggregator(变量聚合器)组件。
- 数据源 (Data sources):
- 支持 S3 兼容的数据源,例如 MinIO。
- 增加了与 JIRA 的数据同步功能。
- 持续重新设计了 Profile(个人主页)的版面布局。
- 将 Flask Web 框架从同步升级为异步,提升了并发能力,防止了在请求上游大语言模型服务时导致的阻塞问题。
已修复问题 (Fixed issues)
- 修复了 v0.22.0 中存在的一个问题:在使用精简版 (slim) 或全量版 (full) RAGFlow 版本时,在已包含解析文件的知识库中,用户可能会无法解析新上传的文件或无法切换嵌入模型。
- 修复了 Word 文档中图片拼接重叠的问题。 #11310
- 修复了对话历史中图文混合内容无法正确显示的问题。
新支持模型 (Newly supported models)
- Gemini 3 Pro 预览版
v0.22.0
2025 年 11 月 12 日发布。
不兼容变更 (Breaking Changes)
从本版本开始,我们仅提供不含内置嵌入模型的精简版 (slim edition) Docker 镜像,并且不再在镜像标签中追加 -slim 后缀。
新特性 (New Features)
- 知识库 (Dataset):
- 支持从五个在线数据源(AWS S3, Google Drive, Notion, Confluence, Discord)同步数据。
- RAPTOR 可以在整个知识库或单个文档上进行构建。
- 解析流水线 (Ingestion pipeline):支持在 Parser(解析器)组件中采用 Docling 文档解析。
- 推出了全新的图形化 Web 后台管理面板,用于用户管理和系统状态监控。
- 智能体 (Agent):
- 支持结构化输出。
- 支持在 Retrieval(检索)组件中进行元数据过滤。
- 引入了具有数据操作和会话变量定义能力的 Variable aggregator(变量聚合器)组件。
改进 (Improvements)
- 智能体 (Agent):支持在 Await Response(等待响应)组件中可视化前续组件 of 输出。
- 重构了模型提供商 (model providers) 页面。
- 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.5。
新增模型 (Added Models)
- Kimi-K2-Thinking
新智能体模板 (New agent templates)
- 交互式智能体 (Interactive Agent):整合了实时用户反馈,可以动态优化智能体的输出。
v0.21.1
2025 年 10 月 23 日发布。
新特性 (New features)
- 实验性功能:支持使用 MinerU 进行 PDF 文档解析。参见此处。
改进 (Improvements)
- 优化了知识库与个人中心页面的 UI/UX。
- 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.1。
已修复问题 (Fixed issues)
- 修复了视频解析存在的问题。
v0.21.0
2025 年 10 月 15 日发布。
新特性 (New features)
- 可编排的解析流水线 (Orchestratable ingestion pipeline):支持自定义的数据摄入与清洗工作流,允许用户在画布上灵活设计其数据流,或直接应用官方提供的数据流模板。
- 优化了 GraphRAG & RAPTOR 的写入流程:将自动增量构建过程替换为手动批量构建,显著降低了构建开销。
- 长上下文 RAG:自动生成文档级的目录大纲 (TOC) 结构,以减轻由于不精确或过多的分块而导致的上下文丢失,显著改善了检索质量。该功能现已通过 TOC 提取模板提供。参见此处。
- 视频文件解析:支持视频文件解析,从而扩展了系统的多模态数据处理能力。
- 命令行管理工具 (Admin CLI):引入了全新的用于系统管理的命令行工具,允许用户通过命令行来管理和监测 RAGFlow 的服务状态。
改进 (Improvements)
- 重新设计了 RAGFlow 的登录和注册页面。
- 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.0。
新支持模型 (Newly supported models)
- 腾讯/通义千问 Qwen 3 系列
- Claude Sonnet 4.5
- 美团 LongCat-Flash-Thinking
新智能体模板 (New agent templates)
- 公司研究报告深度研读智能体:专为金融机构设计,帮助分析师快速梳理信息、生成研报并进行投资决策。
- 可编排的解析流水线模板:允许用户在画布上直接应用此模板,以快速建立标准化的数据摄入和清洗流程。
v0.20.5
2025 年 9 月 10 日发布。
改进 (Improvements)
- 智能体 (Agent):
- 对话 (Chat):重新启用了“深度思考 (Reasoning)”和“跨语言检索 (Cross-language search)”。
新支持模型 (Newly supported models)
- 美团 LongCat
- Kimi: kimi-k2-turbo-preview 和 kimi-k2-0905-preview
- Qwen: qwen3-max-preview
- 硅基流动 (SiliconFlow): DeepSeek V3.1
已修复问题 (Fixed issues)
- 知识库 (Dataset):修复了已删除的文件仍然可以被搜索到的问题。
- 对话 (Chat):修复了无法与 Ollama 模型进行对话的问题。
- 智能体 (Agent):
- 修复了 Cite(引用)开关失效的问题。
- 修复了任务模式下的智能体仍然需要对话才能触发的问题。
- 修复了多轮对话中可能出现重复答案的问题。
- 修复了并行执行结果的重复总结问题。
API 变更 (API changes)
HTTP API
- 在 检索块 (Retrieve chunks) 方法中增加了一个 Body 参数
"metadata_condition",支持在检索时基于元数据对分块进行过滤。 #9877
Python API
- 在 检索块 (Retrieve chunks) 方法中增加了一个参数
metadata_condition,支持在检索时基于元数据对分块进行过滤。 #9877
v0.20.4
2025 年 8 月 27 日发布。
改进 (Improvements)
- 智能体 (Agent) 组件:完成了智能体组件的中文本地化。
- 引入了
ENABLE_TIMEOUT_ASSERTION环境变量,用于启用或禁用文件解析任务的超时断言。 - 知识库 (Dataset):
- 优化了 Markdown 文件解析,支持 AST 以避免不必要的分块。
- 增强了 HTML 解析,支持基于 bs4 的 HTML 标签遍历。
新支持模型 (Newly supported models)
智谱 GLM-4.5
新智能体模板 (New Agent templates)
电商客服工作流 (Ecommerce Customer Service Workflow):旨在利用内部知识库处理有关产品特性和多产品对比的咨询,并管理安装预约。
已修复问题 (Fixed issues)
- 知识库 (Dataset):
- 修复了无法与团队成员共享资源的问题。
- 移除了对上传文件数量和大小的不合理限制。
- 对话 (Chat):
- 修复了在回复中无法预览被引用文件的问题。
- 修复了上传文件后无法发送消息的问题。
- 修复了 OAuth2 认证失败的问题。
- 修复了知识库内多元数据检索的逻辑错误。
- 修复了多轮对话中引用信息无限重复递增的问题。
v0.20.3
2025 年 8 月 20 日发布。
改进 (Improvements)
- 重新设计了 Datasets(知识库)、Chat(对话)和 Search(搜索)页面的用户界面。
- 搜索与对话:引入了文档级元数据过滤,支持在对话或搜索过程中自动或手动进行过滤。
- 搜索:支持创建为各种业务场景量身定制的搜索应用。
- 对话:支持在单个对话页面上对比最多三个对话模型设置的回答表现。
- 智能体 (Agent):
- 在 Agent 组件中实现了一个开关,用于启用或禁用引用。
- 引入了拖拽式的组件创建方法。
- 文档:修正了 API 参考文档中的一些不准确之处。
新智能体模板 (New Agent templates)
- 报表智能体 (Report Agent):用于在内部问答场景中生成摘要报表,支持展示表格和公式。 #9427
已修复问题 (Fixed issues)
- 修复了 v0.20.0 中引入的超时机制导致 GraphRAG 等任务停滞的问题。
- 修复了对话过程中 Agent 组件丢失预定义开场白的问题。
- 修复了提示词编辑器中自动换行的问题。
- 修复了由 PyPDF 导致的内存泄漏问题。 #9469
API 变更 (API changes)
已废弃
v0.20.1
2025 年 8 月 8 日发布。
新特性 (New Features)
- Retrieval(检索)组件现在支持使用变量动态指定知识库名称。
- 用户界面现已包含法语语言选项。
新支持模型 (Newly supported models)
- GPT-5
- Claude 4.1
新智能体模板 (包括工作流和智能体模式)
- Text-to-SQL 数据专家工作流:赋予非技术团队(如运营、产品)自主查询业务数据的能力。
- 自由选择知识库工作流 (Choose Your Knowledge Base Workflow):允许用户在对话过程中自主选择想要检索的知识库。 #9325
- 自由选择知识库智能体 (Choose Your Knowledge Base Agent):通过延长推理时间,提供更高质量的回复,适用于复杂查询。 #9325
已修复问题 (Fixed Issues)
- 修复了 Agent 组件无法调用通过 vLLM 安装的模型的问题。
- 修复了智能体无法在团队中共享的问题。
- 修复了将智能体嵌入网页时运行不正常的问题。
v0.20.0
2025 年 8 月 4 日发布。
兼容性变更 (Compatibility changes)
从 v0.20.0 开始,智能体不再向后兼容旧版本,升级后必须重新构建所有先前版本中已有的智能体。
新特性 (New features)
- 智能体 (Agents) 与工作流 (Workflows) 的统一编排。
- 对智能体进行了全面重构,大幅增强了其能力和易用性,支持多智能体 (Multi-Agent) 配置、规划与反思以及可视化功能。
- 完整实现了模型上下文协议 (MCP) 功能,允许导入 MCP 服务器,智能体可作为 MCP 客户端,同时 RAGFlow 本身也可以作为 MCP 服务器运行。
- 支持访问智能体的运行时日志。
- 可通过后台管理面板查看与智能体的历史对话记录。
- 集成了全新、更稳定的 Infinity 版本,在以 Infinity 作为底层文档引擎时,支持自动打标签功能。
- 兼容 OpenAI 的 API,支持文件参考信息。
- 支持新模型,包括 Kimi K2、Grok 4 和 Voyage 嵌入模型。
- RAGFlow 的代码仓库现已在码云 (Gitee) 同步镜像。
- 引入了新的模型提供商 Gitee AI。
新增智能体模板 (New agent templates introduced)
- 基于多智能体的深度研究 (Multi-Agent based Deep research):由主智能体与多个子智能体协同组成的团队,有别于传统的工作流编排。
- 基于内部知识库的智能问答聊天机器人:专为客服和培训场景设计。
- 简历分析模板:由 RAGFlow 团队用于筛选、分析和记录候选人信息。
- 博客生成工作流:将粗糙的想法转化为利于 SEO 的博客内容。
- 智能客服工作流。
- 用户反馈分析模板:通过语义分析将用户反馈分发给适当的团队。
- 旅行规划大师 (Trip planner):使用网页搜索和地图 MCP 服务器辅助旅行规划。
- 照片文本翻译器:翻译上传照片中的内容。
- 信息检索助手:可同时从内部知识库和互联网检索答案。
v0.19.1
2025 年 6 月 23 日发布。
已修复问题 (Fixed issues)
- 修复了高并发请求下的内存泄漏问题。
- 修复了在启用 GraphRAG 实体消解时,大文件解析卡死的问题。 #8223
- 修复了在单机模式下使用沙箱 (Sandbox) 时出现的上下文错误。 #8340
- 修复了由 Ollama 引起的 CPU 占用过高的问题。 #8216
- 修复了代码组件 (Code Component) 中的一个 Bug。 #7949
- 修复了通过 API 创建数据集时,对通过 Ollama 或 vLLM 安装的模型的支持。 #8069
- 支持对 S3 桶访问的基于角色的认证。 #8149
新支持模型 (Newly supported models)
v0.19.0
2025 年 5 月 26 日发布。
新特性 (New features)
- 知识库与对话模块现已支持跨语言搜索,提升了在多语言环境(例如中英双语知识库)下的搜索精度与用户体验。
- 智能体组件:全新的 Code(代码)组件支持 Python 和 JavaScript 脚本,使开发人员能够处理更复杂的任务(如动态数据处理)。
- 增强的图像展示:对话和搜索中的图像现在可直接在答案中渲染,而不再显示为外部引用。知识库检索测试可以直接检索到图像本身,而不是提取自图像的文本。
- Claude 4 和 ChatGPT o3:开发人员现在可以使用全新发布的、最先进的 Claude 模型以及 OpenAI 最新的 ChatGPT o3 推理模型。
以下特性由我们的社区贡献:
- 智能体组件:支持在 Generate(生成)组件中调用工具。感谢 notsyncing。
- Markdown 渲染:Markdown 文件中的图像引用可以在分块后正常显示。感谢 Woody-Hu。
- 文档引擎支持:支持使用 OpenSearch 作为 RAGFlow 的文档引擎。感谢 pyyuhao。
文档更新 (Documentation)
新增文档
v0.18.0
2025 年 4 月 23 日发布。
兼容性变更 (Compatibility changes)
从此版本开始,移除了内置的重排 (Rerank) 模型,因为它们对检索率的提升微乎其微,但却显著增加了检索时间。
新特性 (New features)
- MCP 服务器:支持通过 MCP 访问 RAGFlow 的知识库/数据集。
- DeepDoc 支持在文档版面识别时引入 VLM 模型作为处理流水线,支持对 PDF 和 DOCX 文件中的图像进行深入分析。
- 兼容 OpenAI 的 API:现在可以通过兼容 OpenAI 的 API 来调用智能体 (Agents)。
- 用户注册控制:管理员可以通过环境变量来启用或禁用用户注册。
- 团队协同:智能体现在可以与团队成员共享。
- 智能体版本控制:所有的更新都会被持续记录,并且可以通过导出回滚至先前版本。

改进 (Improvements)
- 增强的引用呈现:提升了所生成答案中引用的准确性。
- 优化了问答体验:用户现在可以在对话过程中手动停止流式输出。
文档更新 (Documentation)
新增文档
v0.17.2
2025 年 3 月 13 日发布。
兼容性变更 (Compatibility changes)
- 从对话配置中移除了 Max_tokens 设置。
- 从 Generate、Rewrite、Categorize、Keyword 智能体组件中移除了 Max_tokens 设置。
从此版本开始,如果您发现 RAGFlow 的回复仍然被截断或变短,请检查您的模型提供商的 Max_tokens 设置。
改进 (Improvements)
- 增加了兼容 OpenAI 的 API。
- 引入了德语用户界面。
- 加快了知识图谱的提取速度。
- 在 Retrieval 智能体组件中,支持基于 Tavily 的网页搜索。
- 增加了通义千问 QwQ 模型(兼容 OpenAI API)。
- 并在 General(通用)分块方法中支持 CSV 文件。
已修复问题 (Fixed issues)
- 修复了 v0.17.1 中引入的导致无法通过 Ollama/Xinference 添加模型的问题。
API 变更 (API changes)
HTTP API
Python API
v0.17.1
2025 年 3 月 11 日发布。
改进 (Improvements)
- 提升了英文分词器的质量。
- 优化了 Markdown 文档解析中的表格提取逻辑。
- 更新了 SiliconFlow 的模型列表。
- 支持解析 XLS 文件(Excel 97-2003),并改善了相应的错误处理。
- 支持 Hugging Face 重排 (Rerank) 模型。
- 并在对话助手和 Rewrite 智能体组件中,支持相对时间表达(如 "now"、"yesterday"、"last week"、"next year" 等)。
已修复问题 (Fixed issues)
- 修复了重复的知识图谱提取问题。
- 修复了 API 调用的一些问题。
- 修复了 PDF 解析器(文档解析器)下拉列表选项丢失的问题。
- 修复了 Tavily 网页搜索的故障。
- 修复了在 AI 对话中无法预览图表或图像的问题。
文档更新 (Documentation)
新增文档
v0.17.0
2025 年 3 月 3 日发布。
新特性 (New features)
- AI 对话:为基于智能体的推理引入了“深度研究 (Deep Research)”。要在对话助手中启用它,请在对话的 Prompt engine(提示词引擎)标签页下开启 Reasoning(推理)开关。
- AI 对话:利用基于 Tavily 的网页搜索来增强智能体推理过程中的上下文。要启用此功能,请在对话助手的 Assistant settings 标签页下输入正确的 Tavily API 密钥。
- AI 对话:支持在不指定知识库的情况下直接开启对话。
- AI 对话:除了 PDF 文件外,HTML 文件现在也可以进行预览和引用。
- 知识库 (Dataset):在知识库配置中增加了 PDF parser(PDF 解析器)下拉菜单。包括非常耗时但效果极佳的 DeepDoc 模型选项、跳过 DLA(文档版面分析)、OCR(光学字符识别)和 TSR(表格结构识别)任务从而速度极快的 naive 选项(纯文本模式),以及几个目前尚处于实验性的大模型选项。参见此处。
- 智能体组件:在 Generate(生成)或 Template(模板)组件的系统提示词字段中,可以使用双括号键
(x)或斜杠/来快速插入可用的变量。 - 对象存储:支持使用阿里云 OSS (Object Storage Service) 作为文件存储方案。
- 模型:更新了通义千问 (Qwen) 支持的模型列表,并增加了 DeepSeek 的专有模型;新增了 ModelScope(魔搭社区)作为模型提供商。
- API:可以通过 API 更新文档的元数据。
下图展示了 RAGFlow 深度研究 (Deep Research) 的工作流程:

以下是整合了深度研究的对话截图:

API 变更 (API changes)
HTTP API
在 更新文档 方法中增加了一个 Body 参数 "meta_fields"。
Python API
在 更新文档 方法中增加了一个参数 "meta_fields"。
文档更新 (Documentation)
新增文档
v0.16.0
2025 年 2 月 6 日发布。
新特性 (New features)
- 支持 DeepSeek R1 和 DeepSeek V3。
- 重构了 GraphRAG:知识图谱现在是基于整个知识库动态构建的,而不是基于单个文件,并且当新上传的文件开始解析时会自动进行更新。参见此处。
- 增加了 Iteration(循环迭代)智能体组件以及 Research report generator(研究报告生成器)智能体模板。参见此处。
- 新增 UI 语言:葡萄牙语。
- 允许为知识库中的特定文件设置元数据以增强 AI 对话。参见此处。
- 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.0.dev3。
- 支持为 DeepDoc 开启 GPU 加速(参见 docker-compose-gpu.yml)。
- 支持创建并引用 Tag(标签)知识库,作为弥合查询与回答之间语义鸿沟的关键举措。
标签知识库 (Tag dataset) 功能在以 Infinity 作为文档引擎时不可用。
文档更新 (Documentation)
新增文档
- 构建知识图谱
- 设置元数据
- Begin(开始)组件
- Generate(生成)组件
- Interact(交互)组件
- Retrieval(检索)组件
- Categorize(分类)组件
- Keyword(关键词提取)组件
- Message(消息)组件
- Rewrite(重写)组件
- Switch(条件分支)组件
- Concentrator(聚合器)组件
- Template(模板)组件
- Iteration(循环迭代)组件
- Note(注释)组件
v0.15.1
2024 年 12 月 25 日发布。
升级 (Upgrades)
- 将 RAGFlow 的文档引擎 Infinity 升级至 v0.5.2。
- 优化了文档解析状态的日志显示。
已修复问题 (Fixed issues)
本版本修复了以下问题:
- 修复了 Infinity 返回的
SCORE not found和position_int报错。 - 修复了修改特定知识库中的嵌入模型后,其他知识库的嵌入模型无法更改的问题。
- 修复了由于嵌入模型重复加载导致的问答和 AI 搜索响应缓慢的问题。
- 修复了无法使用 RAPTOR 解析文档的问题。
- 修复了使用 Table(表格)解析方法时导致的信息丢失问题。
- 修复了若干 API 问题。
API 变更 (API changes)
HTTP API
在以下 API 中增加了一个可选参数 "user_id":
v0.15.0
2024 年 12 月 18 日发布。
新特性 (New features)
- 引入了额外的智能体专有 API。
- 支持在使用多个知识库进行联合检索时,通过 PageRank 页面评分来优化检索性能。
- 在对话和智能体中提供了 iframe 嵌入机制,方便您轻松将 RAGFlow 集成到您的网页中。
- 提供了用于在 Kubernetes 上部署 RAGFlow 的 Helm chart。
- 支持以 JSON 格式导入或导出智能体。
- 支持在智能体组件/工具中进行单步运行 (step run) 调试。
- 新增 UI 语言:日语。
- 支持在 GraphRAG 和 RAPTOR 构建失败后进行断点恢复,增强了任务管理的鲁棒性。
- 增加了更多的 Mistral 模型。
- 在界面中支持暗黑模式,允许用户在亮色和暗色主题之间进行自由切换。
改进 (Improvements)
- 升级了 DeepDoc 中的文档版面分析 (Document Layout Analysis) 模型。
- 显著提升了以 Infinity 作为文档引擎时的检索性能。
API 变更 (API changes)
HTTP API
Python API
v0.14.1
2024 年 11 月 29 日发布。
改进 (Improvements)
增加了 Infinity 的配置文件 以方便作为文档引擎的 Infinity 的集成和调优。从此版本开始,直接在 RAGFlow 内修改 Infinity 的配置即可生效,在使用 docker compose 重启 RAGFlow 后立刻应用。 #3715
已修复问题 (Fixed issues)
本版本修复了以下问题:
- 修复了点击分块后无法显示或编辑其内容的问题。
- 修复了 Elasticsearch 返回的
'Not found'错误。 - 修复了在解析过程中中文文本可能出现乱码的问题。
- 修复了与 Polars 的兼容性故障。
- 修复了 Infinity 与 GraphRAG 的兼容性冲突。
v0.14.0
2024 年 11 月 26 日发布。
新特性 (New features)
- 支持采用 Infinity 或 Elasticsearch(默认)作为文档引擎,用于向量存储和全文索引。 #2894
- 通过为智能体增加更多的全局变量并实现自动保存,优化了用户体验。
- 增加了由社区贡献的三步翻译智能体模板,其灵感源于 吴恩达 (Andrew Ng) 的翻译智能体。
- 增加了利于 SEO 优化的博客写作智能体模板。
- 提供了用于与智能体交流的 HTTP 和 Python API。
- 在检索流程中支持使用英文同义词。
- 优化了词权重算法,使检索耗时缩短了 50%。
- 引入了更多的运行性能监控指标,提升了对任务执行器的监测能力。
- 使用 Valkey 替代了 Redis。
- 社区贡献并新增了三门 UI 语言:印尼语、西班牙语和越南语。
兼容性变更 (Compatibility changes)
从此版本开始,service_config.yaml.template 替代了 service_config.yaml 用于配置后端服务。在 Docker 容器启动时,该模板文件中定义的环境变量会自动填充,并据此自动生成 service_config.yaml。 #3341
这种方式省去了在修改 .env 之后手动更新 service_config.yaml 的繁琐,使动态环境配置更加便捷。
在尝试这种新方式之前,请务必确保已将您的代码和 Docker 镜像全部升级至此版本。
API 变更 (API changes)
HTTP API
Python API
文档更新 (Documentation)
新增文档
v0.13.0
2024 年 10 月 31 日发布。
新特性 (New features)
- 对所有用户开放了团队管理功能。
- 升级了智能体 UI 面板以提高易用性。
- 在 General(通用)分块方法中,增加了对 Markdown 分块的支持。
- 在智能体 UI 中引入了 invoke 组件工具。
- 实现了对 Dify 知识库 API 的集成支持。
- 增加了对 GLM4-9B 和 Yi-Lightning 模型的支持。
- 引入了用于数据集/知识库管理、知识库内文件管理以及对话助手管理的 HTTP 和 Python API。
若要下载 RAGFlow 的 Python SDK,请使用:
pip install ragflow-sdk==0.13.0
文档更新 (Documentation)
新增文档
v0.12.0
2024 年 9 月 30 日发布。
新特性 (New features)
- 提供了精简版 (slim editions) 的 RAGFlow Docker 镜像,其中不内置 BGE/BCE 嵌入模型和重排模型。
- 改善了多轮对话的响应效果。
- 允许用户删除已添加的大语言模型厂商。
- 增加了对 OpenTTS 和 SparkTTS 模型的支持。
- 在 General 分块方法中实现了一个 Excel to HTML 开关,支持用户按行将电子表格解析为 HTML 表格或键值对形式。
- 增加了 YahooFinance(雅虎金融)和 Jin10(金十数据)等智能体工具。
- 增加了投资顾问智能体模板。
兼容性变更 (Compatibility changes)
- 从此版本开始,RAGFlow 提供精简版 Docker 镜像,以便为网络受限的用户提供更佳的体验。精简版镜像不包含内置的 BGE/BCE 嵌入模型,大小约为 1GB;全量版镜像包含两个内置嵌入模型,大小约为 9GB。
- 默认 Docker 镜像版本为
nightly-slim。以下清单阐明了各种版本之间的区别:nightly-slim:最新测试版 Docker 镜像的精简版本。v0.12.0-slim:最新官方发布 Docker 镜像的精简版本。nightly:最新测试版 Docker 镜像的全量版本。v0.12.0:最新官方发布 Docker 镜像的全量版本。
- 升级步骤请参阅升级 RAGFlow。
文档更新 (Documentation)
新增文档
v0.11.0
2024 年 9 月 14 日发布。
新特性 (New features)
- 在 RAGFlow 界面中推出了 AI 搜索功能。
- 支持通过 FishAudio 或 通义千问 TTS 导出语音。
- 支持除了 MySQL 之外,使用 PostgreSQL 来存储系统元数据。
- 支持选用 S3 或 Azure Blob 作为对象存储。
- 支持新模型厂商:Anthropic、Voyage AI 和 Google Cloud。
- 支持使用腾讯云 ASR 进行音频内容识别。
- 增加了金融领域的专有智能体组件:WenCai(同花顺问财)、AkShare、YahooFinance(雅虎金融)以及 TuShare。
- 增加了医疗顾问智能体模板。
- 支持在以下数据集上运行检索基准测试 (Retrieval benchmarking):
v0.10.0
2024 年 8 月 26 日发布。
新特性 (New features)
- 在智能体 UI 中引入了 text-to-SQL(文本转 SQL)模板。
- 实现了智能体相关 API。
- 引入了对任务执行器的性能监测。
- 引入了 GitHub、DeepL、百度翻译 (BaiduFanyi)、和风天气 (QWeather) 和 GoogleScholar(谷歌学术)等智能体工具。
- 支持 EML(电子邮件)格式的分块解析。
- 支持了更多的大语言模型或模型托管服务:GPT-4o-mini、PerfXCloud、TogetherAI、Upstage、Novita AI、零一万物 (01.AI)、硅基流动 (SiliconFlow)、PPIO、科大讯飞星火 (XunFei Spark)、接口AI (Jiekou.AI)、百度文心一言 (Baidu Yiyan) 和 腾讯混元 (Tencent Hunyuan)。
v0.9.0
2024 年 8 月 6 日发布。
新特性 (New features)
- 支持以 GraphRAG 作为分块策略。
- 引入了智能体组件 Keyword,并新增了 百度 (Baidu)、DuckDuckGo、PubMed、维基百科 (Wikipedia)、必应 (Bing) 和 谷歌 (Google) 等网页搜索工具。
- 支持对音频文件进行语音转文本 (speech-to-text) 识别。
- 支持模型厂商 Gemini 和 Groq。
- 支持包括 LM Studio、OpenRouter、LocalAI 以及 Nvidia API 在内的推理框架、推理引擎和云服务。
- 支持在 Xinference 中使用重排 (Reranker) 模型。
v0.8.0
2024 年 7 月 8 日发布。
新特性 (New features)
- 支持智能体增强的检索生成 (Agentic RAG),允许基于有向图在画布上为 RAG 和智能体构建工作流流程。
- 支持模型提供商 Mistral、MiniMax(稀宇科技)、Bedrock 和 Azure OpenAI。
- 在 Manual(手动分块)方法中,新增对 DOCX 文件的支持。
- 在 Q&A(问答分块)方法中,新增对 DOCX、MD 和 PDF 文件的支持。
v0.7.0
2024 年 5 月 31 日发布。
新特性 (New features)
- 支持使用重排 (Reranker) 模型。
- 整合了重排和嵌入模型:BCE、BGE 以及 Jina。
- 支持大语言模型百川 (Baichuan) 和火山引擎 (VolcanoArk)。
- 引入了 RAPTOR 来提升文本检索效果。
- 在 GENERAL(通用分块)方法中,支持 HTML 文件。
- 提供了用于通过 ID 删除文档的 HTTP 和 Python API。
- 支持 ARM64 平台。
虽然我们也在 ARM64 平台上测试 RAGFlow,但我们不维护适用于 ARM 的 RAGFlow Docker 镜像。
如果您使用的是 ARM 平台,请参阅此指南来构建 RAGFlow Docker 镜像。
API 变更 (API changes)
HTTP API
Python API
v0.6.0
2024 年 5 月 21 日发布。
新特性 (New features)
- Supports streaming output.
- Provides HTTP and Python APIs for retrieving document chunks.
- Supports monitoring of system components, including Elasticsearch, MySQL, Redis, and MinIO.
- Supports disabling Layout Recognition in the GENERAL chunking method to reduce file chunking time.
API 变更 (API changes)
HTTP API
Python API
v0.5.0
2024 年 5 月 8 日发布。
新特性 (New features)
- Supports LLM DeepSeek.