在 DeepWiki 上探索 RAGFlow (Explore RAGFlow on DeepWiki)
这是一个由 AI 生成、始终保持最新的知识库,用于理解 RAGFlow 的代码库 —— 专为进行二次开发或深入探究 RAGFlow 内部机制的开发者设计。
注意
DeepWiki 上的 RAGFlow 内容是由 DeepWiki 维护的,而非 RAGFlow 官方团队。它可能会滞后于最新的官方发布版本。请始终参考官方 RAGFlow 文档 和 源码 以获取最新、最准确的信息。
什么是 DeepWiki?
DeepWiki 空间是一款由 AI 驱动的工具,它能自动阅读 GitHub 仓库的源代码、测试用例和文档,从而生成一个结构化的、交互式的 Wiki 页面。它能够勾勒出架构图、模块关系、数据流和设计基本原理 —— 所有这些都无需手动编写文档。
RAGFlow 的 DeepWiki 页面
RAGFlow 项目的索引地址为:
https://deepwiki.com/infiniflow/ragflow
目标读者
此资源主要适用于以下人员:
- 二次开发者:想要扩展或定制 RAGFlow 的开发人员(例如,添加新的文档解析器(Parser)、集成新的大语言模型供应商或修改检索管道)。
- 贡献者:在提交 PR 之前,需要了解特定模块如何融入整体架构的人员。
- 研究人员和工程师:想要研究 RAGFlow 内部设计原理的人员 —— 如分块策略(Chunking strategies)、嵌入流水线(Embedding pipelines)、基于图的检索以及智能体编排(Agent orchestration)。
提示
若要了解 RAGFlow 的常规用法(如配置知识库、运行对话等),指南 (Guides) 章节会是更好的起点。
您可以在 DeepWiki 上找到什么
| 主题 | 寻找的内容 |
|---|---|
| 整体架构 | 高层级组件图,展示了 api/、rag/、deepdoc/、agent/ 和 web/ 之间是如何相互关联的 |
| 文档摄取流水线 (Document Ingestion) | 文件如何从 上传 → 解析 (deepdoc/) → 分块 (Chunking) → 嵌入 (Embedding) → 存储 |
| 检索流水线 (Retrieval) | 查询是如何被处理的、混合检索 (Hybrid Search, 关键词 + 向量) 是如何工作的,以及如何应用重排 (Reranking) |
| 智能体框架 (Agent) | agent/ 如何编排多步推理、工具调用(Tool Calling)和记忆机制 |
| LLM / 嵌入抽象 | rag/llm/ 如何在统一接口后包装不同的模型供应商 |
| API 层 | api/apps/ 的 Blueprint 路由如何映射到内部服务调用 |
在本地开发中配合使用 DeepWiki
当您对代码库进行更改时,DeepWiki 可以帮您快速回答以下问题:
- “任务执行的入口在哪里?”
- “哪个类处理 PDF 页面分割?”
- “知识图谱检索与稠密向量路径有何不同?”
您也可以利用其内置的对话界面用自然语言向 DeepWiki 提问 —— 它会根据实际的源代码来回答您的问题。
保持 Wiki 最新
当上游的 main 分支更新时,DeepWiki 会自动对仓库重新建立索引。如果您发现已索引的内容滞后于最近的发布版本,您可以在 DeepWiki 页面上手动触发重新建立索引。
相关资源
- 从源码启动服务 —— 搭建本地 RAGFlow 开发环境。
- 构建 RAGFlow Docker 镜像 —— 在修改代码后构建自定义镜像。
- 贡献指南 —— 在理解代码库后如何提交 PR。