Files

Multica PM Agent 343a5eebe3

Sync to Gitee / sync (push) Has been cancelled

Details

docs(rag): add MemoryBear RAG implementation docs v1.0

Submit the formed RAG documentation set produced across Sprint-1/2/3
(WS-12 through WS-26) under docs/rag/. Includes:

- README.md / INDEX.md: landing + total index (responsibility matrix,
  review verdicts, dual-link to source issues)
- overview/: full-pipeline architecture (4 .mmd diagrams),
  11-stage boundary contracts, doc map, source-code inventory
- pipeline/: 5 deep-dives (Loader/Parser/Chunking, Embedding,
  VDB & retrieval, GraphRAG, Rerank/Prompt/LLM)
- graphrag/, end-to-end/: v1.0 formal versions with full source
  retained as reference
- evolution/: 11 architecture-refactor proposals,
  6-direction roadmap, capability map
- review/: S3-T1 / S3-T2 final reviews, S2-T7 final summary
- _indexes/: glossary (81 terms), source->doc reverse index, chart index
- _release/: v1.0-RC1 release manifest, versioning convention,
  ops & freshness plan
- _meta/README.md: placeholder noting WS-12 governance assets gap

Aggregate review score 92.6/100 (8/8 PASS, 31/31 source-code spot
checks hit). The legacy docs/ ignore in .gitignore is narrowed to
docs/* with an explicit allowlist for docs/rag/.

Refs: WS-26
Co-authored-by: multica-agent <github@multica.ai>

2026-05-09 10:51:48 +08:00

8.7 KiB

Raw Blame History

MemoryBear RAG Docs · 运营与保鲜计划

目标：让 docs/rag/ 不沦为"上线那天的快照"，而是与 MemoryBear 一同进化的活水。 责任主线：知识运营与治理专家牵头，与 PM / AI 知识库专家 / Python 工程师协同。

1. 保鲜原则（Why）

一句话：代码会跑，文档会过期；过期速度比新代码合并的速度还快。

失效快：MemoryBear 在 Sprint-3 内合并的关键改造（如 Reranker 缓存、Embedder Protocol、node.py:327 print 删除）会在 1-2 周内让相关文档章节失同步。
影响大：本套文档是 toB 客户、二次开发者、内部 oncall 的"事实来源"；与代码不一致会直接误导决策。
维护成本可控：用统一的"评审 + 增量更新 + 自动归档"三段式机制，把维护成本摊到每次 release，而不是堆在年度大修。

2. 保鲜节奏（When）

2.1 与 release 同步评审（强制）

每次 MemoryBear 主仓发 release（语义化版本 v0.x.y）时：

时点	动作	责任人
release 准备期 -7d	自动扫描：`git diff <last-release-tag>..HEAD -- 'api/app/core/rag/**'` 列出受影响文件	PM 或脚本
release 准备期 -5d	知识运营对受影响文件清单进行"文档涟漪映射"（用 `_indexes/file-index.md`）	知识运营
release 准备期 -3d	责任专家修订对应文档章节（最低粒度：源码引用行号、配置项默认值、流程描述）	AI 知识库 / Python 工程
release day	知识运营终审；通过后将 `source-commit` 刷到新 commit	知识运营
release day +1d	在 `evolution/CHANGELOG.md`（v1.1 起新增）写入"对应 MemoryBear `v0.x.y` 的文档增量"	知识运营

2.2 季度全量复审（强制）

每季度（3 / 6 / 9 / 12 月末）做一次"对所有文档的轻量复审"：

步骤	内容
1	抽样 30%（每类文档至少 1 篇）做"源码引用一致性"抽查（用 `_indexes/file-index.md` 对应行号 grep ±3 行）
2	检查每个文档的 `last-reviewed-at`，超过 3 个月的标记为"待复审"
3	评分（按 5 维卡），低于 75 的文档启动 Should-Fix 流程；低于 60 的文档启动 Must-Fix
4	季度报告（约 1 页）发到 WS-11 作为里程碑通告

2.3 用户反馈驱动评审（按需）

任何外部读者（开发者、客户）在子任务 issue 中反馈"文档与代码不一致"或"文档不清楚"，触发：

24h 内：知识运营响应 + 复核
48h 内：责任专家修订或返回澄清
保留：作为评审记录留在子任务评论中，季度报告时统计"反馈密度"作为质量指标

3. 保鲜机制（How）

3.1 责任矩阵

文档类别	主责（修订）	终审	升版决定
`_meta/` 治理资产	知识运营	知识运营自审	知识运营
`overview/` 总览	AI 知识库	知识运营	联合
`pipeline/` 各环节	Python 工程	知识运营	联合
`graphrag/` GraphRAG	Python 工程	知识运营	联合
`end-to-end/` E2E	AI 知识库	知识运营	联合
`evolution/` 演进	AI 知识库	知识运营	联合
`review/` 评审报告	知识运营	知识运营自审	知识运营
`_indexes/` 索引	知识运营	知识运营自审	知识运营
`_release/` 发布	知识运营	知识运营自审 + PM	知识运营 + PM

3.2 过期判定规则（自动 + 人工）

文档进入"过期候选"状态满足以下任一：

触发条件	判定
`last-reviewed-at` 距今 ≥ 90 天且 `source-commit` 与当前 main HEAD 差距 ≥ 50 commits	自动标记
用户反馈"文档与代码不一致"且复核成立	立即标记
文档关联的代码模块在 release 中有变更（用 `git diff` 检测）	自动标记
文档评分 < 80 且未在 14 天内启动修订	自动标记

标记后进入 _release/freshness-queue.md（v1.1 起新建）。每周一上午 PM 在 WS-11 评论"本周保鲜任务"通告。

3.3 修订流程（强制走 SOP）

所有修订都要遵循 _meta/review-sop.md：

作者自检 ≤ 30 min（用 _meta/scoring-rubric.md）
同行评审 ≤ 48 h（≥ 同 Sprint 1 名其他作者）
知识运营终审 ≤ 24 h
通过 → 合并 PR；未通过 → 退回作者，最多 2 轮

紧急 hot-fix（如调试 print 残留、源码引用错误）可走"快速通道"：直接知识运营 + PM 双人共审 ≤ 4 h，事后补同行评审记录。

3.4 归档机制

文档被替换或并入新文档时：保留 6 个月，再迁移到 docs/rag/_archive/<year>/。
归档保留可读性（保留 frontmatter 的 status: deprecated），不删除。
季度报告中列出"本季归档清单"。

4. 关键指标（Metric）

4.1 内容质量指标

指标	目标	测量方式
文档评分均值	≥ 85	季度评审打分
评审通过率（一次过）	≥ 75%	季度评审统计
源码引用一致率（抽查）	100%	季度抽样 30% × ±3 行 grep
失效文档占比（last-reviewed-at > 6 月）	≤ 10%	自动扫描

4.2 使用与反馈指标

指标	目标	测量方式
月活读者（PV）	TBD（v1.1 起埋点）	Wiki 自带统计
用户反馈数（季度）	≥ 5 条	子任务 issue 评论统计
反馈解决率（30 天内闭环）	≥ 90%	issue 状态统计
搜索无结果率（"用户搜了什么找不到"）	≤ 5%	Wiki 搜索日志（v1.2 起）

4.3 协作健康指标

指标	目标	测量方式
修订到合并的中位时间	≤ 3 天	PR 数据
紧急 hot-fix 数量（季度）	≤ 2	issue 标签统计
评审反馈采纳率	≥ 80%	终审记录

5. 治理工具（推荐落地）

工具	作用	落地阶段
Markdown lint（`markdownlint`）	检查 frontmatter 完整性、链接有效性	v1.0 PR 前接入 CI
链接巡检（`lychee`）	自动跑死链 / 失效 mention	v1.1
Mermaid 校验（`@mermaid-js/parser`）	校验 .mmd 文件可渲染	v1.0 PR 前
`source-commit` 对齐脚本	检查 frontmatter 的 commit 是否在 main 历史中可达	v1.0 PR 前
失效扫描器	比对 `last-reviewed-at` 与 main HEAD diff，输出过期候选清单	v1.1（与 PM 协同）
评分卡 LLM 助手	用大模型对文档做初评，节省人工	v1.2
Wiki 同步器	`.md` → MkDocs / Material 自动构建	v1.0 同步落地

6. 与 PM 的协同节律

频次	内容	出口物
每周一	PM 在 WS-11 评论"本周关注点"	通告
每周三	知识运营点检本周已交付文档，必要时介入	评分卡更新
每周五 EOB	责任专家在子任务评论"本周完成 + 下周计划"	子任务通告
每月初	知识运营汇总月度评分均值，更新 `_release/quality-dashboard.md`（v1.1 起新增）	月报
每季度	全量复审（§2.2） + 给 PM 提交季度报告	季报（约 1 页）
每次 release	同步评审 + 升版 + CHANGELOG（§2.1）	release 通告

7. 失败模式与止损（备灾）

风险	触发场景	止损
知识运营长期不在场	评审节奏断	提前指定 backup（建议 [@AI 知识库专家] + [@PM] 共审）
大量文档同时过期（如重大重构）	无法在一个 release 内修完	按"先核心后边缘"分批：核心（pipeline/03 + evolution）→ overview → pipeline 其余 → graphrag → end-to-end
用户反馈与责任专家判断冲突	修订悬而未决	由 PM 仲裁；保留双方陈述在 issue
评分卡刚性导致一线积极性下降	因小错频繁返工	季度复盘评估"评分卡是否过严"，必要时调整 Should-Fix 与 Must-Fix 边界

8. 一年内重要里程碑（建议）

时点	内容
2026-05-08	v1.0-RC1（本次发布）
2026-05-22 ~ 05-29	S2-T7 评审收口；S2-T4/T6 文档补齐；目标升版 v1.0
2026-06-01 ~ 06-05	S3 全套文档落入仓库 PR；启动 S3-T4 PM 复盘
2026-Q3	S3-T1 §3.1 短期路线图全部合入 → v1.1
2026-Q4	S3-T2 PoC-A / PoC-B 落地，回填实测数据 → v1.2
2027-Q1-Q2	4 大 Protocol 落地 + OTel 接入 → v2.0-RC
2027-H2	多模态 / 增量图等长期方向落地 → v2.0 正式

— Operations & Freshness Plan · v1.0-RC1 · 2026-05-08 —

8.7 KiB Raw Blame History Unescape Escape