跳到主要内容

版本发布记录 (Releases)

最新版本中的关键特性、改进和缺陷修复。

v0.25.2

2026 年 5 月 11 日发布。

改进 (Improvements)

  • API 重构与统一:持续将 Web API 转换到 RESTful 规范,确保所有历史端点的向后兼容性。

数据源 (Data source)

  • 引入了轻量级快照机制,用于在八个数据源(包括 Moodle、钉钉 AI 多维表和 RSS)之间同步已删除的文件,确保忠实反映所有远程数据源的状态。 #14362#14499

缺陷修复 (Bug fixes)

  • 修复了在从 v0.24.0 升级至 v0.25.0 期间元数据可见性损坏的问题。
  • 修复了重复的对话输出问题。
  • 修复了在内存中处理元数据过滤而不是利用 Elasticsearch,从而导致性能瓶颈的问题。 #14576

v0.25.1

2026 年 4 月 29 日发布。

改进 (Improvements)

  • API 重构与统一:在所有端点上将 Web API 标准化为 RESTful 规范,统一文档创建和索引流程,同时保持向后兼容性。
  • 解析优化:新增 OpenDataLoader PDF 解析器后端。 #14097
  • 针对大型 PDF(超过 50 页)引入了惰性加载和分块解析,显著减少了内存占用。 #14385

数据源 (Data source)

支持在 Bitbucket、Gmail、Google Drive 和 Airtable 中同步已删除的文件。 #14362

模型支持 (Model support)

  • DeepSeek v4

模型提供商 (Model providers)

  • UCloud

缺陷修复 (Bug fixes)

  • 修复了在从 v0.24.0 升级至 v0.25.0 期间元数据可见性损坏的问题。
  • 修复了重复的对话输出问题。

v0.25.0

2026 年 4 月 21 日发布。

新特性 (New features)

  • 智能体 (Agent)
    • 引入了七个预置的解析流水线 (Ingestion Pipeline) 模板。
    • 支持发布智能体应用。
    • 支持沙箱代码执行与图表生成。
    • 新增初学者数据分析智能体模板。
  • 记忆 (Memory):支持用户级的记忆存储与检索。
  • 新增 UI 语言:阿拉伯语(实现了从右到左的 RTL 布局)、保加利亚语和土耳其语。
  • 生态系统集成:支持通过 OpenClaw 访问 RAGFlow 知识库/数据集。

改进 (Improvements)

  • 通过支持图像惰性加载优化了 Docx 解析,降低了内存占用。
  • 优化了对话、智能体和搜索的嵌入式对话页面,以适配移动端兼容性。
  • 底层系统与基础设施优化
    • 将 RAGFlow 的文档引擎 Elasticsearch 升级至 9.x。
    • 鉴于官方 MinIO 镜像已被弃用,将默认的对象存储容器切换为 pgsty/minio
    • 新增数据库迁移脚本;详情请参阅此自述文件

模型支持 (Model support)

  • MiniMax-M2.7 系列
  • Perplexity 嵌入模型 (pplx-embed)
  • 通义重排 (Rerank) 模型

新模型提供商 (New model providers)

  • avian.io
  • ragcon.ai

数据源 (Data sources)

  • Seafile
  • RSS
  • 钉钉 AI 多维表 (DingTalk AI Table)
  • GitHub:支持同步已删除的文件。

v0.24.0

2026 年 2 月 10 日发布。

新特性 (New features)

  • 记忆 (Memory)
    • 引入了记忆管理 API(HTTP 和 Python)。
    • 在控制台输出记忆提取日志。
  • 知识库 (Dataset)
    • 支持批量元数据管理。
    • 将 "ToC (目录大纲)" 重命名为 "PageIndex"。参见此处
  • 智能体 (Agent)
    • 推出全新的类似于对话的智能体对话管理界面,可保留会话和对话历史。
    • 引入了支持本地 gVisor 和阿里云的多沙箱 (Sandbox) 机制,并兼容主流的沙箱 API(可在管理后台页面配置)。
  • 对话 (Chat)
    • 新增全新的“深度思考 (Thinking)”模式,并移除了以前的“推理 (Reasoning)”配置选项。
    • 针对深度研究 (Deep Research) 场景优化了检索策略,提升了召回率。
  • 系统管理 (Admin)
    • 支持多个管理员账户。
  • 模型配置中心
    • 针对新引入的模型增加了模型连接测试功能。

MySQL 替代方案 (MySQL alternative)

  • 支持 OceanBase 作为 MySQL 的替代数据库。

模型支持 (Model support)

  • Kimi 2.5
  • 阶跃星辰 (Stepfun) 3
  • 字节跳动豆包视觉嵌入模型 (doubao-embedding-vision)
  • PaddleOCR-VL

数据源 (Data sources)

  • Zendesk
  • Bitbucket

API 变更 (API changes)

HTTP API

记忆管理 API

Python API

记忆管理 API

v0.23.1

2025 年 12 月 31 日发布。

改进 (Improvements)

  • 记忆 (Memory):在选择所有记忆类型时,增强了记忆提取的稳定性。
  • 检索增强生成 (RAG):优化了针对图像和表格的上下文窗口提取策略。

已修复问题 (Fixed issues)

  • 记忆 (Memory):
    • 修复了存在空记忆对象时 RAGFlow 服务器启动失败的问题。
    • 修复了无法删除新创建的空记忆的问题。
  • 检索增强生成 (RAG):此前不支持 MDX 文件解析的问题已修复。

数据源 (Data sources)

  • GitHub
  • GitLab
  • Asana
  • IMAP

v0.23.0

2025 年 12 月 27 日发布。

新特性 (New features)

  • 记忆 (Memory)
    • 实现了用于管理记忆的 Memory(记忆)界面。
    • 支持通过 Retrieval(检索)或 Message(消息)组件配置上下文。
  • 智能体 (Agent)
    • 通过重构底层架构,提升了 Agent(智能体)组件的性能。
    • Agent 组件现在可以输出结构化数据,以供下游组件使用。
    • 支持使用 Webhook 来触发智能体的执行。
    • 支持语音输入/输出。
    • 支持在单个 Agent 组件中配置多个 Retrieval 组件。
  • 解析流水线 (Ingestion pipeline)
    • 支持在 Transformer 组件中提取目录大纲,以改善长上下文 RAG 的性能。
  • 知识库 (Dataset)
    • 支持为图像和表格配置上下文窗口。
    • 引入了父子分块 (parent-child chunking) 策略。
    • 支持在文件解析过程中自动生成元数据。
  • 对话 (Chat):支持语音输入。

改进 (Improvements)

  • RAG:显著加快了 GraphRAG 的生成速度。
  • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.15(向后兼容)。

数据源 (Data sources)

  • Google Cloud Storage
  • Gmail
  • Dropbox
  • WebDAV
  • Airtable

模型支持 (Model support)

  • GPT-5.2
  • GPT-5.2 Pro
  • GPT-5.1
  • GPT-5.1 Instant
  • Claude Opus 4.5
  • MiniMax M2
  • GLM-4.7
  • 提供了 MinerU 配置界面。
  • 支持新模型提供商 AI Badgr。

API 变更 (API changes)

HTTP API

v0.22.1

2025 年 11 月 19 日发布。

改进 (Improvements)

  • 智能体 (Agent):
    • 支持将智能体输出导出为 Word 或 Markdown 格式。
    • 新增 List operations(列表操作)组件。
    • 新增 Variable aggregator(变量聚合器)组件。
  • 数据源 (Data sources):
    • 支持 S3 兼容的数据源,例如 MinIO。
    • 增加了与 JIRA 的数据同步功能。
  • 持续重新设计了 Profile(个人主页)的版面布局。
  • 将 Flask Web 框架从同步升级为异步,提升了并发能力,防止了在请求上游大语言模型服务时导致的阻塞问题。

已修复问题 (Fixed issues)

  • 修复了 v0.22.0 中存在的一个问题:在使用精简版 (slim) 或全量版 (full) RAGFlow 版本时,在已包含解析文件的知识库中,用户可能会无法解析新上传的文件或无法切换嵌入模型。
  • 修复了 Word 文档中图片拼接重叠的问题。 #11310
  • 修复了对话历史中图文混合内容无法正确显示的问题。

新支持模型 (Newly supported models)

  • Gemini 3 Pro 预览版

v0.22.0

2025 年 11 月 12 日发布。

不兼容变更 (Breaking Changes)

重要提示

从本版本开始,我们仅提供不含内置嵌入模型的精简版 (slim edition) Docker 镜像,并且不再在镜像标签中追加 -slim 后缀。

新特性 (New Features)

  • 知识库 (Dataset):
    • 支持从五个在线数据源(AWS S3, Google Drive, Notion, Confluence, Discord)同步数据。
    • RAPTOR 可以在整个知识库或单个文档上进行构建。
  • 解析流水线 (Ingestion pipeline):支持在 Parser(解析器)组件中采用 Docling 文档解析
  • 推出了全新的图形化 Web 后台管理面板,用于用户管理和系统状态监控。
  • 智能体 (Agent):
    • 支持结构化输出。
    • 支持在 Retrieval(检索)组件中进行元数据过滤。
    • 引入了具有数据操作和会话变量定义能力的 Variable aggregator(变量聚合器)组件。

改进 (Improvements)

  • 智能体 (Agent):支持在 Await Response(等待响应)组件中可视化前续组件 of 输出。
  • 重构了模型提供商 (model providers) 页面。
  • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.5。

新增模型 (Added Models)

  • Kimi-K2-Thinking

新智能体模板 (New agent templates)

  • 交互式智能体 (Interactive Agent):整合了实时用户反馈,可以动态优化智能体的输出。

v0.21.1

2025 年 10 月 23 日发布。

新特性 (New features)

  • 实验性功能:支持使用 MinerU 进行 PDF 文档解析。参见此处

改进 (Improvements)

  • 优化了知识库与个人中心页面的 UI/UX。
  • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.1。

已修复问题 (Fixed issues)

  • 修复了视频解析存在的问题。

v0.21.0

2025 年 10 月 15 日发布。

新特性 (New features)

  • 可编排的解析流水线 (Orchestratable ingestion pipeline):支持自定义的数据摄入与清洗工作流,允许用户在画布上灵活设计其数据流,或直接应用官方提供的数据流模板。
  • 优化了 GraphRAG & RAPTOR 的写入流程:将自动增量构建过程替换为手动批量构建,显著降低了构建开销。
  • 长上下文 RAG:自动生成文档级的目录大纲 (TOC) 结构,以减轻由于不精确或过多的分块而导致的上下文丢失,显著改善了检索质量。该功能现已通过 TOC 提取模板提供。参见此处
  • 视频文件解析:支持视频文件解析,从而扩展了系统的多模态数据处理能力。
  • 命令行管理工具 (Admin CLI):引入了全新的用于系统管理的命令行工具,允许用户通过命令行来管理和监测 RAGFlow 的服务状态。

改进 (Improvements)

  • 重新设计了 RAGFlow 的登录和注册页面。
  • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.0。

新支持模型 (Newly supported models)

  • 腾讯/通义千问 Qwen 3 系列
  • Claude Sonnet 4.5
  • 美团 LongCat-Flash-Thinking

新智能体模板 (New agent templates)

  • 公司研究报告深度研读智能体:专为金融机构设计,帮助分析师快速梳理信息、生成研报并进行投资决策。
  • 可编排的解析流水线模板:允许用户在画布上直接应用此模板,以快速建立标准化的数据摄入和清洗流程。

v0.20.5

2025 年 9 月 10 日发布。

改进 (Improvements)

  • 智能体 (Agent):
    • 优化了智能体性能:提高了简单任务的规划与反思速度;针对可并行的场景优化了并发工具调用,大幅缩短了整体响应时间。
    • System prompt(系统提示词)部分提供了四个框架级的提示词块,支持在框架层面对提示词进行自定义和覆写,从而增强了灵活性和控制力。参见此处
    • 增强了 Execute SQL 组件:将原来的变量引用组件替换为文本输入框,允许用户自由编写 SQL 查询并引用变量。参见此处
  • 对话 (Chat):重新启用了“深度思考 (Reasoning)”和“跨语言检索 (Cross-language search)”。

新支持模型 (Newly supported models)

  • 美团 LongCat
  • Kimi: kimi-k2-turbo-preview 和 kimi-k2-0905-preview
  • Qwen: qwen3-max-preview
  • 硅基流动 (SiliconFlow): DeepSeek V3.1

已修复问题 (Fixed issues)

  • 知识库 (Dataset):修复了已删除的文件仍然可以被搜索到的问题。
  • 对话 (Chat):修复了无法与 Ollama 模型进行对话的问题。
  • 智能体 (Agent):
    • 修复了 Cite(引用)开关失效的问题。
    • 修复了任务模式下的智能体仍然需要对话才能触发的问题。
    • 修复了多轮对话中可能出现重复答案的问题。
    • 修复了并行执行结果的重复总结问题。

API 变更 (API changes)

HTTP API

Python API

v0.20.4

2025 年 8 月 27 日发布。

改进 (Improvements)

  • 智能体 (Agent) 组件:完成了智能体组件的中文本地化。
  • 引入了 ENABLE_TIMEOUT_ASSERTION 环境变量,用于启用或禁用文件解析任务的超时断言。
  • 知识库 (Dataset):
    • 优化了 Markdown 文件解析,支持 AST 以避免不必要的分块。
    • 增强了 HTML 解析,支持基于 bs4 的 HTML 标签遍历。

新支持模型 (Newly supported models)

智谱 GLM-4.5

新智能体模板 (New Agent templates)

电商客服工作流 (Ecommerce Customer Service Workflow):旨在利用内部知识库处理有关产品特性和多产品对比的咨询,并管理安装预约。

已修复问题 (Fixed issues)

  • 知识库 (Dataset):
    • 修复了无法与团队成员共享资源的问题。
    • 移除了对上传文件数量和大小的不合理限制。
  • 对话 (Chat):
    • 修复了在回复中无法预览被引用文件的问题。
    • 修复了上传文件后无法发送消息的问题。
  • 修复了 OAuth2 认证失败的问题。
  • 修复了知识库内多元数据检索的逻辑错误。
  • 修复了多轮对话中引用信息无限重复递增的问题。

v0.20.3

2025 年 8 月 20 日发布。

改进 (Improvements)

  • 重新设计了 Datasets(知识库)、Chat(对话)和 Search(搜索)页面的用户界面。
  • 搜索与对话:引入了文档级元数据过滤,支持在对话或搜索过程中自动或手动进行过滤。
  • 搜索:支持创建为各种业务场景量身定制的搜索应用。
  • 对话:支持在单个对话页面上对比最多三个对话模型设置的回答表现。
  • 智能体 (Agent):
    • Agent 组件中实现了一个开关,用于启用或禁用引用。
    • 引入了拖拽式的组件创建方法。
  • 文档:修正了 API 参考文档中的一些不准确之处。

新智能体模板 (New Agent templates)

  • 报表智能体 (Report Agent):用于在内部问答场景中生成摘要报表,支持展示表格和公式。 #9427

已修复问题 (Fixed issues)

  • 修复了 v0.20.0 中引入的超时机制导致 GraphRAG 等任务停滞的问题。
  • 修复了对话过程中 Agent 组件丢失预定义开场白的问题。
  • 修复了提示词编辑器中自动换行的问题。
  • 修复了由 PyPDF 导致的内存泄漏问题。 #9469

API 变更 (API changes)

已废弃

创建智能体对话会话

v0.20.1

2025 年 8 月 8 日发布。

新特性 (New Features)

  • Retrieval(检索)组件现在支持使用变量动态指定知识库名称。
  • 用户界面现已包含法语语言选项。

新支持模型 (Newly supported models)

  • GPT-5
  • Claude 4.1

新智能体模板 (包括工作流和智能体模式)

  • Text-to-SQL 数据专家工作流:赋予非技术团队(如运营、产品)自主查询业务数据的能力。
  • 自由选择知识库工作流 (Choose Your Knowledge Base Workflow):允许用户在对话过程中自主选择想要检索的知识库。 #9325
  • 自由选择知识库智能体 (Choose Your Knowledge Base Agent):通过延长推理时间,提供更高质量的回复,适用于复杂查询。 #9325

已修复问题 (Fixed Issues)

  • 修复了 Agent 组件无法调用通过 vLLM 安装的模型的问题。
  • 修复了智能体无法在团队中共享的问题。
  • 修复了将智能体嵌入网页时运行不正常的问题。

v0.20.0

2025 年 8 月 4 日发布。

兼容性变更 (Compatibility changes)

从 v0.20.0 开始,智能体不再向后兼容旧版本,升级后必须重新构建所有先前版本中已有的智能体。

新特性 (New features)

  • 智能体 (Agents) 与工作流 (Workflows) 的统一编排。
  • 对智能体进行了全面重构,大幅增强了其能力和易用性,支持多智能体 (Multi-Agent) 配置、规划与反思以及可视化功能。
  • 完整实现了模型上下文协议 (MCP) 功能,允许导入 MCP 服务器,智能体可作为 MCP 客户端,同时 RAGFlow 本身也可以作为 MCP 服务器运行。
  • 支持访问智能体的运行时日志。
  • 可通过后台管理面板查看与智能体的历史对话记录。
  • 集成了全新、更稳定的 Infinity 版本,在以 Infinity 作为底层文档引擎时,支持自动打标签功能。
  • 兼容 OpenAI 的 API,支持文件参考信息。
  • 支持新模型,包括 Kimi K2、Grok 4 和 Voyage 嵌入模型。
  • RAGFlow 的代码仓库现已在码云 (Gitee) 同步镜像。
  • 引入了新的模型提供商 Gitee AI。

新增智能体模板 (New agent templates introduced)

  • 基于多智能体的深度研究 (Multi-Agent based Deep research):由主智能体与多个子智能体协同组成的团队,有别于传统的工作流编排。
  • 基于内部知识库的智能问答聊天机器人:专为客服和培训场景设计。
  • 简历分析模板:由 RAGFlow 团队用于筛选、分析和记录候选人信息。
  • 博客生成工作流:将粗糙的想法转化为利于 SEO 的博客内容。
  • 智能客服工作流。
  • 用户反馈分析模板:通过语义分析将用户反馈分发给适当的团队。
  • 旅行规划大师 (Trip planner):使用网页搜索和地图 MCP 服务器辅助旅行规划。
  • 照片文本翻译器:翻译上传照片中的内容。
  • 信息检索助手:可同时从内部知识库和互联网检索答案。

v0.19.1

2025 年 6 月 23 日发布。

已修复问题 (Fixed issues)

  • 修复了高并发请求下的内存泄漏问题。
  • 修复了在启用 GraphRAG 实体消解时,大文件解析卡死的问题。 #8223
  • 修复了在单机模式下使用沙箱 (Sandbox) 时出现的上下文错误。 #8340
  • 修复了由 Ollama 引起的 CPU 占用过高的问题。 #8216
  • 修复了代码组件 (Code Component) 中的一个 Bug。 #7949
  • 修复了通过 API 创建数据集时,对通过 Ollama 或 vLLM 安装的模型的支持。 #8069
  • 支持对 S3 桶访问的基于角色的认证。 #8149

新支持模型 (Newly supported models)

  • Qwen 3 嵌入模型。 #8184
  • Voyage Multimodal 3。 #7987

v0.19.0

2025 年 5 月 26 日发布。

新特性 (New features)

  • 知识库与对话模块现已支持跨语言搜索,提升了在多语言环境(例如中英双语知识库)下的搜索精度与用户体验。
  • 智能体组件:全新的 Code(代码)组件支持 Python 和 JavaScript 脚本,使开发人员能够处理更复杂的任务(如动态数据处理)。
  • 增强的图像展示:对话和搜索中的图像现在可直接在答案中渲染,而不再显示为外部引用。知识库检索测试可以直接检索到图像本身,而不是提取自图像的文本。
  • Claude 4 和 ChatGPT o3:开发人员现在可以使用全新发布的、最先进的 Claude 模型以及 OpenAI 最新的 ChatGPT o3 推理模型。

以下特性由我们的社区贡献:

  • 智能体组件:支持在 Generate(生成)组件中调用工具。感谢 notsyncing
  • Markdown 渲染:Markdown 文件中的图像引用可以在分块后正常显示。感谢 Woody-Hu
  • 文档引擎支持:支持使用 OpenSearch 作为 RAGFlow 的文档引擎。感谢 pyyuhao

文档更新 (Documentation)

新增文档

v0.18.0

2025 年 4 月 23 日发布。

兼容性变更 (Compatibility changes)

从此版本开始,移除了内置的重排 (Rerank) 模型,因为它们对检索率的提升微乎其微,但却显著增加了检索时间。

新特性 (New features)

  • MCP 服务器:支持通过 MCP 访问 RAGFlow 的知识库/数据集。
  • DeepDoc 支持在文档版面识别时引入 VLM 模型作为处理流水线,支持对 PDF 和 DOCX 文件中的图像进行深入分析。
  • 兼容 OpenAI 的 API:现在可以通过兼容 OpenAI 的 API 来调用智能体 (Agents)。
  • 用户注册控制:管理员可以通过环境变量来启用或禁用用户注册。
  • 团队协同:智能体现在可以与团队成员共享。
  • 智能体版本控制:所有的更新都会被持续记录,并且可以通过导出回滚至先前版本。

export_agent

改进 (Improvements)

  • 增强的引用呈现:提升了所生成答案中引用的准确性。
  • 优化了问答体验:用户现在可以在对话过程中手动停止流式输出。

文档更新 (Documentation)

新增文档

v0.17.2

2025 年 3 月 13 日发布。

兼容性变更 (Compatibility changes)

  • 从对话配置中移除了 Max_tokens 设置。
  • 从 Generate、Rewrite、Categorize、Keyword 智能体组件中移除了 Max_tokens 设置。

从此版本开始,如果您发现 RAGFlow 的回复仍然被截断或变短,请检查您的模型提供商的 Max_tokens 设置。

改进 (Improvements)

  • 增加了兼容 OpenAI 的 API。
  • 引入了德语用户界面。
  • 加快了知识图谱的提取速度。
  • Retrieval 智能体组件中,支持基于 Tavily 的网页搜索。
  • 增加了通义千问 QwQ 模型(兼容 OpenAI API)。
  • 并在 General(通用)分块方法中支持 CSV 文件。

已修复问题 (Fixed issues)

  • 修复了 v0.17.1 中引入的导致无法通过 Ollama/Xinference 添加模型的问题。

API 变更 (API changes)

HTTP API

Python API

v0.17.1

2025 年 3 月 11 日发布。

改进 (Improvements)

  • 提升了英文分词器的质量。
  • 优化了 Markdown 文档解析中的表格提取逻辑。
  • 更新了 SiliconFlow 的模型列表。
  • 支持解析 XLS 文件(Excel 97-2003),并改善了相应的错误处理。
  • 支持 Hugging Face 重排 (Rerank) 模型。
  • 并在对话助手和 Rewrite 智能体组件中,支持相对时间表达(如 "now"、"yesterday"、"last week"、"next year" 等)。

已修复问题 (Fixed issues)

  • 修复了重复的知识图谱提取问题。
  • 修复了 API 调用的一些问题。
  • 修复了 PDF 解析器(文档解析器)下拉列表选项丢失的问题。
  • 修复了 Tavily 网页搜索的故障。
  • 修复了在 AI 对话中无法预览图表或图像的问题。

文档更新 (Documentation)

新增文档

v0.17.0

2025 年 3 月 3 日发布。

新特性 (New features)

  • AI 对话:为基于智能体的推理引入了“深度研究 (Deep Research)”。要在对话助手中启用它,请在对话的 Prompt engine(提示词引擎)标签页下开启 Reasoning(推理)开关。
  • AI 对话:利用基于 Tavily 的网页搜索来增强智能体推理过程中的上下文。要启用此功能,请在对话助手的 Assistant settings 标签页下输入正确的 Tavily API 密钥。
  • AI 对话:支持在不指定知识库的情况下直接开启对话。
  • AI 对话:除了 PDF 文件外,HTML 文件现在也可以进行预览和引用。
  • 知识库 (Dataset):在知识库配置中增加了 PDF parser(PDF 解析器)下拉菜单。包括非常耗时但效果极佳的 DeepDoc 模型选项、跳过 DLA(文档版面分析)、OCR(光学字符识别)和 TSR(表格结构识别)任务从而速度极快的 naive 选项(纯文本模式),以及几个目前尚处于实验性的大模型选项。参见此处
  • 智能体组件:在 Generate(生成)或 Template(模板)组件的系统提示词字段中,可以使用双括号键 (x) 或斜杠 / 来快速插入可用的变量。
  • 对象存储:支持使用阿里云 OSS (Object Storage Service) 作为文件存储方案。
  • 模型:更新了通义千问 (Qwen) 支持的模型列表,并增加了 DeepSeek 的专有模型;新增了 ModelScope(魔搭社区)作为模型提供商。
  • API:可以通过 API 更新文档的元数据。

下图展示了 RAGFlow 深度研究 (Deep Research) 的工作流程:

Image

以下是整合了深度研究的对话截图:

Image

API 变更 (API changes)

HTTP API

更新文档 方法中增加了一个 Body 参数 "meta_fields"

Python API

更新文档 方法中增加了一个参数 "meta_fields"

文档更新 (Documentation)

新增文档

v0.16.0

2025 年 2 月 6 日发布。

新特性 (New features)

  • 支持 DeepSeek R1 和 DeepSeek V3。
  • 重构了 GraphRAG:知识图谱现在是基于整个知识库动态构建的,而不是基于单个文件,并且当新上传的文件开始解析时会自动进行更新。参见此处
  • 增加了 Iteration(循环迭代)智能体组件以及 Research report generator(研究报告生成器)智能体模板。参见此处
  • 新增 UI 语言:葡萄牙语。
  • 允许为知识库中的特定文件设置元数据以增强 AI 对话。参见此处
  • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.0.dev3。
  • 支持为 DeepDoc 开启 GPU 加速(参见 docker-compose-gpu.yml)。
  • 支持创建并引用 Tag(标签)知识库,作为弥合查询与回答之间语义鸿沟的关键举措。
重要提示

标签知识库 (Tag dataset) 功能在以 Infinity 作为文档引擎时不可用

文档更新 (Documentation)

新增文档

v0.15.1

2024 年 12 月 25 日发布。

升级 (Upgrades)

  • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.5.2。
  • 优化了文档解析状态的日志显示。

已修复问题 (Fixed issues)

本版本修复了以下问题:

  • 修复了 Infinity 返回的 SCORE not foundposition_int 报错。
  • 修复了修改特定知识库中的嵌入模型后,其他知识库的嵌入模型无法更改的问题。
  • 修复了由于嵌入模型重复加载导致的问答和 AI 搜索响应缓慢的问题。
  • 修复了无法使用 RAPTOR 解析文档的问题。
  • 修复了使用 Table(表格)解析方法时导致的信息丢失问题。
  • 修复了若干 API 问题。

API 变更 (API changes)

HTTP API

在以下 API 中增加了一个可选参数 "user_id"

v0.15.0

2024 年 12 月 18 日发布。

新特性 (New features)

  • 引入了额外的智能体专有 API。
  • 支持在使用多个知识库进行联合检索时,通过 PageRank 页面评分来优化检索性能。
  • 在对话和智能体中提供了 iframe 嵌入机制,方便您轻松将 RAGFlow 集成到您的网页中。
  • 提供了用于在 Kubernetes 上部署 RAGFlow 的 Helm chart。
  • 支持以 JSON 格式导入或导出智能体。
  • 支持在智能体组件/工具中进行单步运行 (step run) 调试。
  • 新增 UI 语言:日语。
  • 支持在 GraphRAG 和 RAPTOR 构建失败后进行断点恢复,增强了任务管理的鲁棒性。
  • 增加了更多的 Mistral 模型。
  • 在界面中支持暗黑模式,允许用户在亮色和暗色主题之间进行自由切换。

改进 (Improvements)

  • 升级了 DeepDoc 中的文档版面分析 (Document Layout Analysis) 模型。
  • 显著提升了以 Infinity 作为文档引擎时的检索性能。

API 变更 (API changes)

HTTP API

Python API

v0.14.1

2024 年 11 月 29 日发布。

改进 (Improvements)

增加了 Infinity 的配置文件 以方便作为文档引擎的 Infinity 的集成和调优。从此版本开始,直接在 RAGFlow 内修改 Infinity 的配置即可生效,在使用 docker compose 重启 RAGFlow 后立刻应用。 #3715

已修复问题 (Fixed issues)

本版本修复了以下问题:

  • 修复了点击分块后无法显示或编辑其内容的问题。
  • 修复了 Elasticsearch 返回的 'Not found' 错误。
  • 修复了在解析过程中中文文本可能出现乱码的问题。
  • 修复了与 Polars 的兼容性故障。
  • 修复了 Infinity 与 GraphRAG 的兼容性冲突。

v0.14.0

2024 年 11 月 26 日发布。

新特性 (New features)

  • 支持采用 Infinity 或 Elasticsearch(默认)作为文档引擎,用于向量存储和全文索引。 #2894
  • 通过为智能体增加更多的全局变量并实现自动保存,优化了用户体验。
  • 增加了由社区贡献的三步翻译智能体模板,其灵感源于 吴恩达 (Andrew Ng) 的翻译智能体
  • 增加了利于 SEO 优化的博客写作智能体模板。
  • 提供了用于与智能体交流的 HTTP 和 Python API。
  • 在检索流程中支持使用英文同义词。
  • 优化了词权重算法,使检索耗时缩短了 50%。
  • 引入了更多的运行性能监控指标,提升了对任务执行器的监测能力。
  • 使用 Valkey 替代了 Redis。
  • 社区贡献并新增了三门 UI 语言:印尼语、西班牙语和越南语。

兼容性变更 (Compatibility changes)

从此版本开始,service_config.yaml.template 替代了 service_config.yaml 用于配置后端服务。在 Docker 容器启动时,该模板文件中定义的环境变量会自动填充,并据此自动生成 service_config.yaml#3341

这种方式省去了在修改 .env 之后手动更新 service_config.yaml 的繁琐,使动态环境配置更加便捷。

重要提示

在尝试这种新方式之前,请务必确保已将您的代码 Docker 镜像全部升级至此版本

API 变更 (API changes)

HTTP API

Python API

文档更新 (Documentation)

新增文档

v0.13.0

2024 年 10 月 31 日发布。

新特性 (New features)

  • 对所有用户开放了团队管理功能。
  • 升级了智能体 UI 面板以提高易用性。
  • General(通用)分块方法中,增加了对 Markdown 分块的支持。
  • 在智能体 UI 中引入了 invoke 组件工具。
  • 实现了对 Dify 知识库 API 的集成支持。
  • 增加了对 GLM4-9B 和 Yi-Lightning 模型的支持。
  • 引入了用于数据集/知识库管理、知识库内文件管理以及对话助手管理的 HTTP 和 Python API。
提示

若要下载 RAGFlow 的 Python SDK,请使用:

pip install ragflow-sdk==0.13.0

文档更新 (Documentation)

新增文档

v0.12.0

2024 年 9 月 30 日发布。

新特性 (New features)

  • 提供了精简版 (slim editions) 的 RAGFlow Docker 镜像,其中不内置 BGE/BCE 嵌入模型和重排模型。
  • 改善了多轮对话的响应效果。
  • 允许用户删除已添加的大语言模型厂商。
  • 增加了对 OpenTTSSparkTTS 模型的支持。
  • General 分块方法中实现了一个 Excel to HTML 开关,支持用户按行将电子表格解析为 HTML 表格或键值对形式。
  • 增加了 YahooFinance(雅虎金融)和 Jin10(金十数据)等智能体工具。
  • 增加了投资顾问智能体模板。

兼容性变更 (Compatibility changes)

  • 从此版本开始,RAGFlow 提供精简版 Docker 镜像,以便为网络受限的用户提供更佳的体验。精简版镜像不包含内置的 BGE/BCE 嵌入模型,大小约为 1GB;全量版镜像包含两个内置嵌入模型,大小约为 9GB。
  • 默认 Docker 镜像版本为 nightly-slim。以下清单阐明了各种版本之间的区别:
    • nightly-slim:最新测试版 Docker 镜像的精简版本。
    • v0.12.0-slim:最新官方发布 Docker 镜像的精简版本。
    • nightly:最新测试版 Docker 镜像的全量版本。
    • v0.12.0:最新官方发布 Docker 镜像的全量版本。
  • 升级步骤请参阅升级 RAGFlow

文档更新 (Documentation)

新增文档

v0.11.0

2024 年 9 月 14 日发布。

新特性 (New features)

  • 在 RAGFlow 界面中推出了 AI 搜索功能。
  • 支持通过 FishAudio通义千问 TTS 导出语音。
  • 支持除了 MySQL 之外,使用 PostgreSQL 来存储系统元数据。
  • 支持选用 S3 或 Azure Blob 作为对象存储。
  • 支持新模型厂商:AnthropicVoyage AIGoogle Cloud
  • 支持使用腾讯云 ASR 进行音频内容识别。
  • 增加了金融领域的专有智能体组件:WenCai(同花顺问财)、AkShareYahooFinance(雅虎金融)以及 TuShare
  • 增加了医疗顾问智能体模板。
  • 支持在以下数据集上运行检索基准测试 (Retrieval benchmarking):

v0.10.0

2024 年 8 月 26 日发布。

新特性 (New features)

  • 在智能体 UI 中引入了 text-to-SQL(文本转 SQL)模板。
  • 实现了智能体相关 API。
  • 引入了对任务执行器的性能监测。
  • 引入了 GitHubDeepL百度翻译 (BaiduFanyi)和风天气 (QWeather)GoogleScholar(谷歌学术)等智能体工具。
  • 支持 EML(电子邮件)格式的分块解析。
  • 支持了更多的大语言模型或模型托管服务:GPT-4o-miniPerfXCloudTogetherAIUpstageNovita AI零一万物 (01.AI)硅基流动 (SiliconFlow)PPIO科大讯飞星火 (XunFei Spark)接口AI (Jiekou.AI)百度文心一言 (Baidu Yiyan)腾讯混元 (Tencent Hunyuan)

v0.9.0

2024 年 8 月 6 日发布。

新特性 (New features)

  • 支持以 GraphRAG 作为分块策略。
  • 引入了智能体组件 Keyword,并新增了 百度 (Baidu)DuckDuckGoPubMed维基百科 (Wikipedia)必应 (Bing)谷歌 (Google) 等网页搜索工具。
  • 支持对音频文件进行语音转文本 (speech-to-text) 识别。
  • 支持模型厂商 GeminiGroq
  • 支持包括 LM StudioOpenRouterLocalAI 以及 Nvidia API 在内的推理框架、推理引擎和云服务。
  • 支持在 Xinference 中使用重排 (Reranker) 模型。

v0.8.0

2024 年 7 月 8 日发布。

新特性 (New features)

  • 支持智能体增强的检索生成 (Agentic RAG),允许基于有向图在画布上为 RAG 和智能体构建工作流流程。
  • 支持模型提供商 MistralMiniMax(稀宇科技)、BedrockAzure OpenAI
  • Manual(手动分块)方法中,新增对 DOCX 文件的支持。
  • Q&A(问答分块)方法中,新增对 DOCX、MD 和 PDF 文件的支持。

v0.7.0

2024 年 5 月 31 日发布。

新特性 (New features)

  • 支持使用重排 (Reranker) 模型。
  • 整合了重排和嵌入模型:BCEBGE 以及 Jina
  • 支持大语言模型百川 (Baichuan) 和火山引擎 (VolcanoArk)。
  • 引入了 RAPTOR 来提升文本检索效果。
  • GENERAL(通用分块)方法中,支持 HTML 文件。
  • 提供了用于通过 ID 删除文档的 HTTP 和 Python API。
  • 支持 ARM64 平台。
重要提示

虽然我们也在 ARM64 平台上测试 RAGFlow,但我们不维护适用于 ARM 的 RAGFlow Docker 镜像。

如果您使用的是 ARM 平台,请参阅此指南来构建 RAGFlow Docker 镜像。

API 变更 (API changes)

HTTP API

Python API

v0.6.0

2024 年 5 月 21 日发布。

新特性 (New features)

  • Supports streaming output.
  • Provides HTTP and Python APIs for retrieving document chunks.
  • Supports monitoring of system components, including Elasticsearch, MySQL, Redis, and MinIO.
  • Supports disabling Layout Recognition in the GENERAL chunking method to reduce file chunking time.

API 变更 (API changes)

HTTP API

Python API

v0.5.0

2024 年 5 月 8 日发布。

新特性 (New features)

  • Supports LLM DeepSeek.
本页总览