跳到主要内容

在 DeepWiki 上探索 RAGFlow (Explore RAGFlow on DeepWiki)

这是一个由 AI 生成、始终保持最新的知识库,用于理解 RAGFlow 的代码库 —— 专为进行二次开发或深入探究 RAGFlow 内部机制的开发者设计。


注意

DeepWiki 上的 RAGFlow 内容是由 DeepWiki 维护的,而非 RAGFlow 官方团队。它可能会滞后于最新的官方发布版本。请始终参考官方 RAGFlow 文档源码 以获取最新、最准确的信息。

什么是 DeepWiki?

DeepWiki 空间是一款由 AI 驱动的工具,它能自动阅读 GitHub 仓库的源代码、测试用例和文档,从而生成一个结构化的、交互式的 Wiki 页面。它能够勾勒出架构图、模块关系、数据流和设计基本原理 —— 所有这些都无需手动编写文档。

RAGFlow 的 DeepWiki 页面

RAGFlow 项目的索引地址为:

https://deepwiki.com/infiniflow/ragflow

目标读者

此资源主要适用于以下人员:

  • 二次开发者:想要扩展或定制 RAGFlow 的开发人员(例如,添加新的文档解析器(Parser)、集成新的大语言模型供应商或修改检索管道)。
  • 贡献者:在提交 PR 之前,需要了解特定模块如何融入整体架构的人员。
  • 研究人员和工程师:想要研究 RAGFlow 内部设计原理的人员 —— 如分块策略(Chunking strategies)、嵌入流水线(Embedding pipelines)、基于图的检索以及智能体编排(Agent orchestration)。
提示

若要了解 RAGFlow 的常规用法(如配置知识库、运行对话等),指南 (Guides) 章节会是更好的起点。

您可以在 DeepWiki 上找到什么

主题寻找的内容
整体架构高层级组件图,展示了 api/rag/deepdoc/agent/web/ 之间是如何相互关联的
文档摄取流水线 (Document Ingestion)文件如何从 上传 → 解析 (deepdoc/) → 分块 (Chunking) → 嵌入 (Embedding) → 存储
检索流水线 (Retrieval)查询是如何被处理的、混合检索 (Hybrid Search, 关键词 + 向量) 是如何工作的,以及如何应用重排 (Reranking)
智能体框架 (Agent)agent/ 如何编排多步推理、工具调用(Tool Calling)和记忆机制
LLM / 嵌入抽象rag/llm/ 如何在统一接口后包装不同的模型供应商
API 层api/apps/ 的 Blueprint 路由如何映射到内部服务调用

在本地开发中配合使用 DeepWiki

当您对代码库进行更改时,DeepWiki 可以帮您快速回答以下问题:

  • “任务执行的入口在哪里?”
  • “哪个类处理 PDF 页面分割?”
  • “知识图谱检索与稠密向量路径有何不同?”

您也可以利用其内置的对话界面用自然语言向 DeepWiki 提问 —— 它会根据实际的源代码来回答您的问题。

保持 Wiki 最新

当上游的 main 分支更新时,DeepWiki 会自动对仓库重新建立索引。如果您发现已索引的内容滞后于最近的发布版本,您可以在 DeepWiki 页面上手动触发重新建立索引。

相关资源