
Overview
Dosphere 的 RAG 能力不是 demo 级“向量召回 + 拼接 prompt”,而是可配置的多层 pipeline:
Query Analysis → Hybrid Retrieval → Fusion Ranking → Conditional Rerank → Tool-governed Answering → Traceable Persistence
每一层都有独立职责与参数,支持持续优化与质量评估。
Problem
常见 RAG 系统在真实知识库场景中容易出现:
- 检索命中不稳,术语问题表现差
- 回答看似合理但缺证据来源
- 质量无法量化,参数调优靠猜
Objective
- 提升不同意图下的检索质量
- 保证回答可追溯、可验证
- 保持问答体验和系统延迟平衡
- 建立可持续迭代的数据闭环
Approach
Query Analysis
识别 SEARCH / COMPARE / SUMMARY 等意图并动态调参。
Hybrid Retrieval
融合向量、关键词、标题、路径四路检索,覆盖不同查询类型。
Fusion + Rerank
采用加权 RRF 融合并按条件触发 rerank,提升候选排序质量。
Traceable Answering
回答附证据块与来源链接,并记录完整 trace 以支持离线评估。
Solution
最终交付的是生产可用的知识问答能力:在保障回答质量的同时保留过程可见性,使模型输出从“能用”升级为“可信且可演进”。

