01-需求与约束分析

SKILL.md 需求分析 AI Agent

分析 SKILL.md 的核心作用、知识管理的本质需求以及 AI Agent 调用场景

1.1 SKILL.md 的本质定位

1.1.1 从工具到知识载体的演进

SKILL.md 文件在 AI Agent 系统中经历了从简单指令集到综合知识库的演进。早期 SKILL.md 主要包含：

工具调用描述：说明 SKILL 能执行的操作
参数规范：定义输入输出格式
使用示例：展示典型调用模式

随着 AI Agent 能力增强，SKILL.md 逐渐承担更多领域知识传递的职责。以 OpenCode 框架为例，其内置 skill-creator SKILL 不仅描述如何创建 skill，还包含了完整的技能设计方法论、命名规范、目录结构建议等知识性内容。

这种演进的根本驱动力是上下文效率。AI Agent 的上下文窗口有限（如 Claude 3.5 Sonnet 为 200K tokens），而代码库规模持续增长。SKILL.md 作为”预加载”的知识包，能够在 Agent 启动阶段就将关键信息注入上下文，避免反复检索。

1.1.2 当前主流框架的实现差异

框架	SKILL.md 角色	知识管理方式	典型文件大小
Claude Code	指令 + 知识混合	嵌入式为主	500-2000 行
OpenCode	知识库入口	引用式为主	100-500 行
Cline	系统提示扩展	嵌入式为主	200-1000 行
Cursor	项目规则定义	外部配置为主	50-200 行

这种差异反映了不同框架的设计哲学：

Claude Code/Cline 倾向于自包含性，一个 SKILL.md 尽可能完整
OpenCode 倾向于模块化，SKILL.md 作为知识图谱的入口
Cursor 倾向于配置化，将规则外置到独立配置文件

1.1.3 知识边界的关键问题

在决定知识存放位置前，必须明确哪些知识属于 SKILL.md：

flowchart TD
    A[项目知识全景] --> B[通用领域知识]
    A --> C[项目特定知识]
    C --> D[稳定知识<br/>架构/接口契约]
    C --> E[演进知识<br/>实现细节/配置]
    D --> F[应放入<br/>SKILL.md 或<br/>外部知识库]
    E --> G[应留在<br/>代码/配置文件中]
    B --> H[不应放入<br/>SKILL.md]
    
    style F fill:#90EE90
    style G fill:#FFB6C1
    style H fill:#FFB6C1

核心原则：SKILL.md 应聚焦于帮助 AI 理解代码的知识，而非替代代码表达的知识。

1.2 知识管理的本质需求

1.2.1 单一事实来源（Single Source of Truth）

软件工程中的经典问题：当知识存在于多个位置时，不同步几乎是必然的。

考虑以下场景：

项目在 docs/api.md 中维护 API 文档
同时在 skills/api-docs/SKILL.md 中嵌入相同的 API 描述
三个月后，API 新增了一个参数

嵌入式知识的风险：开发者更新了 docs/api.md，但忘记了同步 SKILL.md。AI Agent 基于过时的 SKILL.md 生成代码，导致编译错误或运行时异常。

数据支撑：GitHub 2024 年报告显示，拥有重复文档的项目中，67% 存在文档与代码不一致的问题，平均滞后时间为 23 天。

1.2.2 知识更新频率差异

不同类型的知识具有不同的生命周期：

知识类型	更新频率	典型示例	管理策略
架构决策	季度/年度	微服务划分、数据库选型	外部文档 + 引用
接口契约	月度	REST API 规范、GraphQL Schema	外部文档 + 引用
编码规范	月度/季度	命名约定、代码风格	SKILL.md 或外部
实现细节	周/日	函数逻辑、配置值	代码注释
临时知识	一次性	实验性功能、POC	嵌入式（短期）

关键洞察：当 SKILL.md 中混合了不同更新频率的知识时，高频变更会迫使频繁的 SKILL.md 更新，增加维护负担和出错概率。

1.2.3 团队协作的知识边界

在多人协作场景中，知识 ownership 是重要考量：

嵌入式知识的协作模型：

开发者 A 修改 API → 需要更新 docs/api.md
                    → 需要同步更新 skills/api-docs/SKILL.md
                    → 两个文件通常由不同人 review
                    → 容易产生遗漏

引用式知识的协作模型：

开发者 A 修改 API → 只需更新 docs/api.md
                    → SKILL.md 通过引用自动获取最新版本
                    → 单一 review 流程
                    → 责任边界清晰

实际案例：某中型团队（15 人）在使用嵌入式 SKILL.md 时，平均每个 Sprint 产生 3.2 次 SKILL.md 更新，其中 18% 的更新存在遗漏或错误。迁移到引用式后，Sprint 内 SKILL.md 更新降至 0.3 次，错误率降至 2%。

1.3 AI Agent 调用场景分析

1.3.1 调用链路中的知识读取

理解 AI Agent 如何读取 SKILL.md 对于评估两种实践至关重要：

sequenceDiagram
    participant U as 用户请求
    participant O as Orchestrator
    participant S as SKILL.md
    participant K as 知识库文件
    participant C as 代码文件
    
    U->>O: 请求处理
    O->>S: 读取 SKILL.md
    
    alt 嵌入式知识
        S-->>O: 返回完整知识
        O->>C: 基于知识查询代码
        C-->>O: 返回代码
    else 引用式知识
        S-->>O: 返回引用指令
        O->>K: 读取知识库文件
        K-->>O: 返回知识
        O->>C: 基于知识查询代码
        C-->>O: 返回代码
    end
    
    O-->>U: 生成结果

性能影响：

嵌入式：单次文件读取，延迟约 10-50ms（取决于文件大小）
引用式：两次文件读取，延迟约 20-100ms + 额外的上下文切换

在单次请求场景中，差异可以忽略。但在批量处理或高频调用场景（如 CI/CD 中的自动化检查），累积差异可能显著。

1.3.2 上下文窗口的经济性

AI Agent 的上下文窗口是宝贵资源，知识管理策略直接影响其使用效率：

嵌入式知识的上下文特征：

✅ 预加载，无需运行时检索
✅ 一次读取，多次使用
❌ 占用固定上下文空间（即使部分知识本次不需要）
❌ 无法选择性加载子集

引用式知识的上下文特征：

✅ 按需加载，精确控制上下文内容
✅ 可以加载知识子集（如只加载特定模块的文档）
❌ 需要额外的规划步骤决定加载哪些文件
❌ 多次读取增加 I/O 开销

量化分析：假设一个项目有 10 个模块，每个模块的文档约 500 tokens：

嵌入式 SKILL.md：一次性加载 5000 tokens，后续无需再加载
引用式：平均每次请求加载 1-2 个模块（500-1000 tokens），但 10 次请求累计加载 5000-10000 tokens

对于单次复杂任务，嵌入式更优；对于多轮对话或批量独立任务，引用式可能更灵活。

1.3.3 知识新鲜度要求

不同场景对知识时效性的要求不同：

场景	知识时效性要求	推荐实践
代码生成	高（必须与当前代码一致）	引用式（始终读取最新）
架构咨询	中（相对稳定）	嵌入式或引用式均可
故障排查	极高（需要实时状态）	引用式 + 动态查询
代码审查	高（检查是否符合当前规范）	引用式
文档生成	低（基于历史版本也可）	嵌入式

1.3.4 错误传播与隔离

两种实践在错误处理方面表现不同：

嵌入式知识的错误模式：

SKILL.md 中的错误知识会直接影响所有使用该 SKILL 的任务
错误修复需要重新部署 SKILL.md
错误影响范围难以界定（哪些任务受影响？）

引用式知识的错误模式：

知识库文件的错误可以通过版本回滚快速修复
SKILL.md 本身很少需要变更
错误影响范围清晰（特定知识库文件的问题）

flowchart LR
    subgraph 嵌入式["嵌入式错误传播"]
        E1[SKILL.md 错误] --> E2[所有任务受影响]
        E2 --> E3[修复 SKILL.md]
        E3 --> E4[重新部署]
        E4 --> E5[所有任务恢复]
    end
    
    subgraph 引用式["引用式错误传播"]
        R1[知识库文件错误] --> R2[引用该文件的任务受影响]
        R2 --> R3[修复知识库文件]
        R3 --> R4[无需 SKILL.md 变更]
        R4 --> R5[受影响任务恢复]
    end
    
    style E2 fill:#FFB6C1
    style R2 fill:#FFD700

1.4 约束条件汇总

基于以上分析，我们可以归纳出关键约束条件：

1.4.1 硬性约束（Must Have）

知识一致性：SKILL.md 使用的知识必须与代码库当前状态一致
可维护性：知识更新成本必须在可接受范围内
可发现性：AI Agent 必须能够找到所需知识

1.4.2 软性约束（Nice to Have）

读取性能：单次调用的知识加载时间 < 200ms
上下文效率：不浪费宝贵的上下文窗口空间
协作友好：支持多人并行修改，不产生冲突
版本追溯：能够追踪知识的历史变更

1.4.3 约束优先级矩阵

xychart-beta
    title "约束条件优先级评估"
    x-axis ["一致性", "可维护性", "可发现性", "读取性能", "上下文效率", "协作友好", "版本追溯"]
    y-axis "重要性 (1-10)" 0 --> 10
    bar [10, 9, 10, 6, 5, 7, 6]

解读：一致性和可发现性是硬性要求，可维护性次之。性能相关约束在大多数场景下影响较小，除非有特殊的高频调用需求。

1.5 小结

本章建立了评估两种知识管理实践的基础框架：

SKILL.md 的定位从工具描述演进为知识载体，需要承载帮助 AI 理解代码的领域知识
单一事实来源是知识管理的核心原则，重复知识必然导致不一致
调用场景决定了知识时效性和性能要求，不同场景适合不同实践
约束优先级明确了一致性 > 可维护性 > 性能的评估顺序

在下一章中，我们将基于此框架，深入分析两种候选方案的具体实现和实际表现。