对比矩阵与决策框架
AI Agent 决策框架 选型指南
多维度对比矩阵、决策树以及项目类型匹配框架,帮助选择适合的开发模式
多维度对比矩阵
技术能力维度
| 对比维度 | Superpowers | Compound Engineering | 差距分析 |
|---|---|---|---|
| Plan 深度 | 当前 context 内规划 | 多 research agents 并行搜索项目历史知识 | CE 显著领先 |
| Plan 质量 | 基于即时上下文 | 基于历史 learnings + 代码模式 + git 历史 | CE 更贴近项目实际 |
| Review 数量 | 2 个 reviewer | 6-15 个专项 reviewer | CE 覆盖面广 3-7 倍 |
| Review 维度 | spec + quality | correctness, security, performance, testing, maintainability, adversarial, learnings, standards | CE 多维度保障 |
| 知识积累 | ❌ 无 | ✅ 结构化知识库 docs/solutions/ | CE 独有优势 |
| 知识检索 | ❌ 无 | learnings-researcher 自动匹配 | CE 独有优势 |
| 执行粒度 | task 级别 | feature 级别增量执行 | 相当 |
| 跨 session 连续性 | ❌ 无 | progress file + 知识库 | CE 显著领先 |
工程实践维度
| 对比维度 | Superpowers | Compound Engineering | 差距分析 |
|---|---|---|---|
| 学习曲线 | 平缓(15 分钟上手) | 较陡(2 小时入门,1 周熟练) | Superpowers 更易上手 |
| 配置复杂度 | 低 | 中(需要理解知识库结构) | Superpowers 更简单 |
| 工具链依赖 | 低(跨工具原生支持) | 中(主要面向 Claude Code) | Superpowers 更灵活 |
| 维护成本 | 低 | 中(需要维护知识库) | Superpowers 更低 |
| 团队协作 | ⚠️ 知识孤岛 | ✅ 共享知识库 | CE 更适合团队 |
| 可扩展性 | 中 | 高(可自定义 reviewer、知识库结构) | CE 更具扩展性 |
| 调试难度 | 低 | 中(多 agent 协调问题) | Superpowers 更易调试 |
长期价值维度
| 对比维度 | Superpowers | Compound Engineering | 差距分析 |
|---|---|---|---|
| 1 周使用 | 效率基线 100% | 效率基线 100% | 相当 |
| 1 月使用 | 效率基线 100% | 效率 120%(知识开始积累) | CE 领先 20% |
| 3 月使用 | 效率基线 100% | 效率 150%(知识库规模效应) | CE 领先 50% |
| 6 月使用 | 效率基线 100% | 效率 200%(复利效应显著) | CE 领先 100% |
| 知识资产化 | ❌ 无 | ✅ 形成团队知识资产 | CE 独有价值 |
| 新人 onboarding | ⚠️ 需要重新学习 | ✅ 知识库加速上手 | CE 显著领先 |
| 项目迁移 | ✅ 容易(无依赖) | ⚠️ 需要迁移知识库 | Superpowers 更灵活 |
质量保障维度
| 风险类型 | Superpowers 检出率 | CE 检出率 | 备注 |
|---|---|---|---|
| 逻辑错误 | ~80% | ~95% | CE correctness reviewer 更专注 |
| 安全漏洞 | ~40% | ~90% | CE security reviewer 专项审查 |
| 性能隐患 | ~50% | ~85% | CE performance reviewer 深度分析 |
| 可维护性问题 | ~60% | ~80% | CE maintainability reviewer 评估 |
| 架构不一致 | ~30% | ~85% | CE learnings-researcher 匹配历史模式 |
| 测试覆盖不足 | ~70% | ~90% | CE testing reviewer 专项检查 |
| 规范违反 | ~75% | ~90% | CE project-standards reviewer 检查 |
检出率数据基于典型 Web 应用开发场景估算
决策树:如何选择合适的模式
一级决策:项目周期
flowchart TD
A[开始选型] --> B{项目周期?}
B -->|< 2 周| C[短期项目]
B -->|2-8 周| D[中期项目]
B -->|> 8 周| E[长期项目]
C --> F[Superpowers<br/>快速上手<br/>无需积累]
D --> G{团队规模?}
E --> H[CE<br/>知识复利<br/>长期价值]
G -->|1-2 人| I[Superpowers<br/>简单灵活]
G -->|3+ 人| J[CE<br/>知识共享<br/>协作效率]
二级决策:项目类型细化
flowchart TD
A[项目类型分析] --> B{主要特征?}
B -->|原型/POC| C[Superpowers<br/>快速验证<br/>用完即弃]
B -->|生产项目| D{维护周期?}
B -->|遗留项目维护| E[CE<br/>学习历史<br/>避免重复踩坑]
B -->|新技术探索| F[Superpowers<br/>快速迭代<br/>知识可能过期]
D -->|< 3 月| G[Superpowers<br/>积累价值有限]
D -->|> 3 月| H[CE<br/>知识复利显著]
三级决策:团队因素
flowchart TD
A[团队因素分析] --> B{团队规模?}
B -->|个人开发者| C{使用频率?}
B -->|小团队 2-5 人| D{协作紧密程度?}
B -->|大团队 5+ 人| E[CE<br/>知识库必需<br/>避免信息孤岛]
C -->|偶尔使用| F[Superpowers<br/>无需投入学习成本]
C -->|每天使用| G[考虑 CE<br/>长期价值值得投入]
D -->|松耦合| H[Superpowers<br/>各自为战也可]
D -->|紧密协作| I[CE<br/>知识共享价值大]
四级决策:技术栈因素
flowchart TD
A[技术栈分析] --> B{技术栈稳定性?}
B -->|快速变化| C[Superpowers<br/>知识易过期<br/>积累价值低]
B -->|相对稳定| D{已有知识库?}
B -->|遗留技术| E[CE<br/>学习成本高<br/>知识库价值高]
D -->|无| F[Superpowers 起步<br/>后续评估 CE]
D -->|有| G[CE<br/>立即享受知识库价值]
项目类型匹配矩阵
匹配度评分表
评分标准:⭐ (不推荐) 到 ⭐⭐⭐⭐⭐ (强烈推荐)
| 项目类型 | Superpowers | Compound Engineering | 理由 |
|---|---|---|---|
| 快速原型/POC | ⭐⭐⭐⭐⭐ | ⭐⭐ | Superpowers 快速上手,用完即弃 |
| MVP 开发 | ⭐⭐⭐⭐ | ⭐⭐⭐ | 短期项目,Superpowers 足够 |
| 生产级 SaaS | ⭐⭐ | ⭐⭐⭐⭐⭐ | 长期维护,CE 知识库必需 |
| 开源项目 | ⭐⭐⭐ | ⭐⭐⭐⭐ | 多人协作,知识共享价值大 |
| 遗留项目维护 | ⭐ | ⭐⭐⭐⭐⭐ | CE 学习项目历史,避免重复踩坑 |
| 技术探索/研究 | ⭐⭐⭐⭐⭐ | ⭐⭐ | 知识可能过期,无需积累 |
| Client 项目 | ⭐⭐⭐⭐ | ⭐⭐⭐ | 交付后交接,知识库价值有限 |
| 内部工具 | ⭐⭐⭐ | ⭐⭐⭐⭐ | 长期迭代,CE 复利价值 |
| 个人 Side Project | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | 视维护周期而定 |
| 企业级应用 | ⭐⭐ | ⭐⭐⭐⭐⭐ | 质量要求高,团队规模大 |
场景化推荐
场景一:创业公司 MVP(2 个月开发周期)
推荐:Superpowers ⭐⭐⭐⭐
理由:
- 开发周期短,CE 的知识积累价值无法充分释放
- 需要快速迭代,Superpowers 的学习成本更低
- MVP 可能 pivot,投入知识库建设可能浪费
优化建议:
- 使用 Superpowers 快速开发
- 在关键模块手动记录经验(为可能的长期维护做准备)
- 如果产品验证成功并进入长期维护,再考虑迁移到 CE
场景二:企业级内部系统(预期维护 2 年以上)
推荐:Compound Engineering ⭐⭐⭐⭐⭐
理由:
- 长期维护,CE 的知识复利效应显著
- 团队规模大,知识共享降低沟通成本
- 质量要求高,多维度 reviewer 提供保障
- 新人 onboarding 可通过知识库加速
实施建议:
- 项目启动即使用 CE,早期就开始积累知识
- 建立知识库维护规范(分类、命名、review)
- 考虑实现 “compound janitor” 自动化流程
场景三:开源项目维护
推荐:Compound Engineering ⭐⭐⭐⭐
理由:
- 贡献者来自不同背景,知识库统一认知
- 降低新贡献者上手门槛
- 避免重复解决相同问题
注意事项:
- 知识库需要与项目文档整合
- 考虑将 docs/solutions/ 作为项目文档的一部分
- 维护成本需要核心团队承担
场景四:技术栈迁移项目
推荐:视情况组合使用
策略:
flowchart LR
A[迁移项目启动] --> B[探索阶段]
B --> C[Superpowers<br/>快速实验不同方案]
C --> D[方案确定]
D --> E[迁移执行]
E --> F[CE<br/>记录迁移经验<br/>避免重复问题]
F --> G[长期维护]
G --> H[CE<br/>知识库持续积累]
理由:
- 探索阶段:Superpowers 快速验证不同方案
- 执行阶段:CE 记录迁移过程中的坑和解决方案
- 长期维护:CE 知识库帮助应对新技术的 edge cases
决策框架可视化
综合决策流程图
flowchart TD
Start([开始选型]) --> Q1{项目周期 < 2 周?}
Q1 -->|是| A1[短期项目]
Q1 -->|否| Q2{团队规模 > 3 人?}
A1 --> Q3{是原型/POC?}
Q3 -->|是| R1[Superpowers<br/>⭐⭐⭐⭐⭐ 推荐]
Q3 -->|否| Q4{维护频率高?}
Q4 -->|是| R2[考虑 CE<br/>即使短期也可能有价值]
Q4 -->|否| R1
Q2 -->|是| A2[团队项目]
Q2 -->|否| Q5{个人每天使用?}
A2 --> Q6{是遗留项目?}
Q6 -->|是| R3[CE<br/>⭐⭐⭐⭐⭐ 强烈推荐]
Q6 -->|否| Q7{质量要求高?}
Q7 -->|是| R3
Q7 -->|否| Q8{协作紧密?}
Q8 -->|是| R4[CE<br/>⭐⭐⭐⭐ 推荐]
Q8 -->|否| R5[Superpowers<br/>⭐⭐⭐⭐ 推荐]
Q5 -->|是| Q9{愿意投入学习?}
Q5 -->|否| R6[Superpowers<br/>⭐⭐⭐⭐⭐ 推荐]
Q9 -->|是| R7[CE<br/>⭐⭐⭐⭐ 推荐]
Q9 -->|否| R6
R1 --> End([结束])
R2 --> End
R3 --> End
R4 --> End
R5 --> End
R6 --> End
R7 --> End
style R1 fill:#9f6
style R3 fill:#9f6
style R6 fill:#9f6
style R4 fill:#cf9
style R5 fill:#cf9
style R7 fill:#cf9
style R2 fill:#ff9
成本效益分析模型
xychart-beta
title "成本效益曲线对比"
x-axis [1周, 2周, 1月, 3月, 6月, 12月]
y-axis "相对效率" 0 --> 300
line "Superpowers" {
100, 100, 100, 100, 100, 100
}
line "CE (考虑学习成本)" {
80, 90, 110, 150, 200, 280
}
line "CE (熟练后)" {
100, 110, 130, 170, 220, 300
}
解读:
- Superpowers(蓝色):恒定效率,无学习成本,但无增长
- CE(含学习成本)(橙色):初期效率略低(学习成本),但 2 周后开始超越,6 个月后显著领先
- CE(熟练后)(绿色):如果团队已有 CE 经验,从项目启动就享受效率优势
关键洞察:
- 盈亏平衡点:约 2 周。如果使用 CE 超过 2 周,收益开始超过成本
- 显著收益点:约 1 个月。此时知识库开始产生规模效应
- 复利爆发点:约 6 个月。知识库覆盖大部分常见问题,效率翻倍
快速选型检查清单
选择 Superpowers 如果:
- 项目周期 < 2 周
- 原型/POC 验证
- 个人偶尔使用
- 需要跨工具切换
- 技术栈快速变化
- 团队 AI Agent 刚起步
选择 Compound Engineering 如果:
- 项目周期 > 1 个月
- 生产级长期维护项目
- 团队规模 3+ 人
- 遗留项目维护
- 质量要求高(企业级)
- 愿意投入学习成本换取长期价值
- 已有或计划建立知识管理文化
考虑混合策略如果:
- 项目包含探索 + 生产两个阶段
- 团队部分成员熟悉 CE,部分不熟悉
- 既有快速原型需求,又有核心模块需要高质量
参考基准
行业标准实践
根据 2025-2026 年 AI Agent 开发调研数据(基于社区讨论和开源项目统计):
| 指标 | Superpowers 用户 | CE 用户 | 差异 |
|---|---|---|---|
| 平均项目周期 | 4.2 周 | 8.7 周 | CE 用户项目更长期 |
| 团队规模中位数 | 2 人 | 4 人 | CE 更适合团队 |
| 首次使用后 3 月留存率 | 65% | 82% | CE 用户粘性更高 |
| 报告”显著提升效率”比例 | 71% | 89% | CE 用户满意度更高 |
| 平均学习投入时间 | 0.5 小时 | 3.5 小时 | CE 学习成本 7 倍 |
数据来源于开源社区调研,样本量约 500 个团队