Logo
热心市民王先生

方案选型对比

技术研究 人工智能 LLM

本节为每个内置 Agent 提供 2-3 个替代模型选项,并说明选择的理由。

3.1 Agent 替代模型推荐

本节为每个内置 Agent 提供 2-3 个替代模型选项,并说明选择的理由。

3.1.1 Sisyphus (主编排 Agent)

当前模型: anthropic/claude-opus-4-5 (EXPENSIVE)

替代方案对比:

替代模型成本reasoningtool_callcoding推荐指数
openai/gpt-5.2EXPENSIVE★★★★★★★★★★★★★★☆⭐⭐⭐⭐⭐
anthropic/claude-sonnet-4-5MEDIUM★★★★☆★★★★☆★★★★☆⭐⭐⭐⭐
google/gemini-3-proMEDIUM★★★★☆★★★★☆★★★★★⭐⭐⭐

选择建议:

  • GPT-5.2:如果你需要更强的推理能力,能接受略微降低的指令遵循准确性
  • Claude Sonnet:预算敏感场景的理想选择,保持 Anthropic 生态一致性
  • Gemini 3 Pro:超长上下文场景(2M tokens),适合巨型代码库

迁移配置示例:

{
  "agents": {
    "sisyphus": {
      "model": "openai/gpt-5.2",
      "temperature": 0.7,
      "maxTokens": 32768
    }
  }
}

3.1.2 Oracle (战略顾问 Agent)

当前模型: openai/gpt-5.2 (EXPENSIVE)

替代方案对比:

替代模型成本reasoningcodingarchitecture推荐指数
anthropic/claude-opus-4-5EXPENSIVE★★★★☆★★★★★★★★★★⭐⭐⭐⭐⭐
anthropic/claude-sonnet-4-5MEDIUM★★★★☆★★★★☆★★★★☆⭐⭐⭐⭐
deepseek/deepseek-r1CHEAP★★★★★★★★★☆★★★☆☆⭐⭐⭐

选择建议:

  • Claude Opus:代码审查场景的最佳选择,架构文档生成质量极高
  • DeepSeek R1:开源推理模型,适合本地部署或成本敏感场景
  • Claude Sonnet:平衡成本和质量的中间选项

3.1.3 Librarian (文档研究 Agent)

当前模型: opencode/glm-4.7-free (FREE)

替代方案对比:

替代模型成本speedtool_calldocumentation推荐指数
google/gemini-3-flashCHEAP★★★★★★★★☆☆★★★★☆⭐⭐⭐⭐⭐
ollama/llama3.2FREE (本地)★★★☆☆★★★☆☆★★★☆☆⭐⭐⭐⭐
opencode/grok-codeCHEAP★★★★★★★★★☆★★★☆☆⭐⭐⭐

选择建议:

  • Gemini Flash:速度极快,适合高频文档查询,成本极低
  • Llama 3.2:完全免费(本地运行),隐私敏感场景首选
  • Grok Code:适合代码仓库探索,响应速度快

迁移配置示例:

{
  "agents": {
    "librarian": {
      "model": "google/gemini-3-flash",
      "temperature": 0.3
    }
  }
}

3.1.4 Explore (代码探索 Agent)

当前模型: google/gemini-3-flashopencode/grok-code (CHEAP)

替代方案对比:

替代模型成本speedsearch_quality推荐指数
opencode/glm-4.7-freeFREE★★★★☆★★★☆☆⭐⭐⭐⭐
anthropic/claude-haiku-4-5CHEAP★★★★★★★★★☆⭐⭐⭐⭐
mistral/mistral-smallCHEAP★★★★☆★★★☆☆⭐⭐⭐

选择建议:

  • GLM-4.7 Free:完全免费替代方案,适合预算极其有限的场景
  • Claude Haiku:Anthropic 的高速轻量模型,保持生态一致性

3.1.5 Frontend UI/UX Engineer (前端开发 Agent)

当前模型: google/gemini-3-pro-preview (CHEAP)

替代方案对比:

替代模型成本codingcreativityattachment推荐指数
anthropic/claude-sonnet-4-5MEDIUM★★★★★★★★★☆★★☆☆☆⭐⭐⭐⭐⭐
openai/gpt-4oCHEAP★★★★☆★★★★☆★★★☆☆⭐⭐⭐⭐
google/gemini-3-flashCHEAP★★★☆☆★★★☆☆★★★★★⭐⭐⭐

选择建议:

  • Claude Sonnet:前端代码生成的最佳选择,Tailwind/React 支持极好
  • GPT-4o:OpenAI 的快速多模态模型,图像转代码能力强
  • Gemini Flash:需要处理大量图像/UI 设计稿时的经济选择

3.1.6 Hephaestus (自主深度工作 Agent)

当前模型: anthropic/claude-opus-4-5 (EXPENSIVE)

替代方案对比:

替代模型成本autonomycodingreasoning推荐指数
openai/gpt-5.2EXPENSIVE★★★★★★★★★★★★★★★⭐⭐⭐⭐⭐
deepseek/deepseek-v3MEDIUM★★★★☆★★★★★★★★★☆⭐⭐⭐⭐
anthropic/claude-sonnet-4-5MEDIUM★★★☆☆★★★★☆★★★☆☆⭐⭐⭐

选择建议:

  • GPT-5.2:自主规划能力极强,适合复杂的多文件重构任务
  • DeepSeek V3:中文代码理解能力强,适合中文注释的代码库

3.2 模型选择决策矩阵

按 Agent 类型推荐的模型组合

┌─────────────────────────────────────────────────────────────────┐
│                    Agent 模型选择决策树                          │
├─────────────────────────────────────────────────────────────────┤
│                                                                  │
│  预算充足场景 (推荐)                                              │
│  ├── Sisyphus: Claude Opus 4.5 (EXPENSIVE)                     │
│  ├── Oracle: GPT-5.2 (EXPENSIVE)                               │
│  ├── Librarian: GLM-4.7 Free (FREE)                            │
│  ├── Explore: Gemini Flash (CHEAP)                             │
│  └── Frontend: Claude Sonnet (MEDIUM)                          │
│                                                                  │
│  经济型场景                                                      │
│  ├── Sisyphus: Claude Sonnet (MEDIUM)                          │
│  ├── Oracle: Claude Sonnet (MEDIUM)                            │
│  ├── Librarian: GLM-4.7 Free (FREE)                            │
│  ├── Explore: GLM-4.7 Free (FREE)                              │
│  └── Frontend: Gemini Flash (CHEAP)                            │
│                                                                  │
│  本地部署场景 (隐私优先)                                          │
│  ├── Sisyphus: Llama 3.3 70B / Qwen 2.5                        │
│  ├── Oracle: DeepSeek R1                                       │
│  ├── Librarian: Llama 3.2                                      │
│  ├── Explore: Qwen 2.5 Coder                                   │
│  └── Frontend: CodeLlama / DeepSeek Coder                      │
│                                                                  │
└─────────────────────────────────────────────────────────────────┘

3.3 成本效益分析

典型使用场景成本估算

假设每月处理 100 个开发任务:

场景模型组合月均成本质量评分性价比
专业版全默认配置$150-3009.5/10⭐⭐⭐⭐
经济版Claude Sonnet + Gemini Flash$30-608.5/10⭐⭐⭐⭐⭐
极简版全免费模型$07.0/10⭐⭐⭐
本地版Ollama 本地模型$0 (硬件成本)7.5/10⭐⭐⭐⭐

成本优化建议

  1. Sisyphus 降级:在简单任务中降级为 Claude Sonnet,可节省 70% 成本
  2. Librarian 并行:使用免费模型并行处理多个文档查询
  3. Explore 缓存:对于重复的代码搜索,启用结果缓存
  4. Oracle 按需调用:仅在架构设计时调用 Oracle,日常开发使用 Sisyphus

3.4 选型理由总结

oh-my-opencode 的默认模型选择基于以下核心原则:

  1. 主编排 Agent 使用最强模型:Sisyphus 作为核心编排器,使用 Claude Opus 确保决策质量
  2. 探索类 Agent 使用经济模型:Librarian 和 Explore 任务量大,使用免费/低价模型控制成本
  3. 专业 Agent 使用专用模型:Frontend UI/UX 使用 Gemini 利用其多模态能力
  4. 保持生态一致性:多个 Agent 使用 Anthropic/OpenAI 模型,便于统一管理和监控

这种设计在保证核心工作流质量的同时,实现了成本的最优化。

参考资料