Anthropic 刚发布了一份 33 页的 Claude Skills 构建指南,覆盖文件结构、YAML frontmatter、渐进式披露、MCP 集成、测试方法论、分发与故障排查。系统、完整、即刻可用。
也是迄今为止最清晰的一张图:Skill 范式的边界在哪里。
指南做对了什么
先说做得好的地方。指南系统化了社区已在独立趋同的几个核心思路:
渐进式披露。 Skill 采用三层架构:YAML 元数据(始终加载)→ SKILL.md 正文(相关时加载)→ 参考文件(按需加载)。这是管理上下文窗口的正确方式。每个 token 都在竞争空间,一个在只需要 50 词时却倾倒 5,000 词指令的 Skill,会拖垮它周围的一切。
MCP + Skill 分层。 指南划出了清晰的界线:MCP 是连接层(Claude 能访问什么),Skill 是知识层(Claude 应该如何使用这些访问权限)。这个区分很重要。一个连接到 Linear 的 MCP Server 给你的是原始 API 访问权。一个叠加在该 MCP 之上的 Skill 教会 Claude 你团队的冲刺规划工作流。没有知识的连接,只是一个更花哨的 API 客户端。
Description 即发现机制。 指南强调 Skill 的 description 字段是它的生存机制。描述含糊(“帮助处理项目”),Skill 永远不会被加载。描述太宽泛(“处理所有文档”),它会在无关查询上误触发然后被禁用。推荐公式——“做什么 + 什么时候用 + 负触发词”——实用且可立即落地。
Skill 作为开放标准。 Anthropic 明确将 Skill 定位为开放标准,类比 MCP。同一个 Skill 应该能跨 Claude、其他 AI 平台和自定义 Agent 使用。这是一个重要的架构选择:它将能力定义从运行时解耦。
这些都是真正的贡献。如果你在构建 AI 工作流,这份指南值得一读。
看不见的天花板
但指南没有问一个问题:当你有 200 个 Skill 的时候,会发生什么?
不是 200 个做不同事情的 Skill——而是 200 个都声称自己能做代码审查的 Skill。或冲刺规划。或数据分析。指南告诉你如何构建一个好的 Skill。但当有五十个候选时,它没有告诉你如何找到最好的那个。
以下是 33 页没有覆盖的内容:
没有适应度指标。 你怎么知道一个 Skill 是否真的好?指南建议对比测试——同一任务分别在有/无 Skill 的情况下运行,衡量 token 消耗和消息轮次。这对 Skill 作者有用。但它给 Skill 消费者什么都没有。当你浏览一个 500 个 Skill 的注册表时,没有分数,没有排名,除了”有人写了一段不错的描述”之外没有任何信号。
没有竞争机制。 在指南的世界里,Skill 被发布后……就存在着。同一领域的两个 Skill 不会竞争。它们不会在相同输入上被对比。没有机制让赢家浮出水面、让输家被淘汰。唯一的选择压力是手动的:某个人两个都试一遍然后挑一个。
没有传播。 一个优秀的 Skill 留在作者放置的地方。没有机制让 Skill A 发现 Skill B(它从未见过的)解决某个子问题更好,然后采纳那个组件。用生物学术语说:没有水平基因转移。
没有生命周期。 Skill 不会老化。当更好的替代品出现时,它们不会被弃用。当它们的 API 依赖断裂时,它们不会被下线。指南提到了元数据中的版本号,但没有生命周期管理的版本号只是标签。
没有保真度模型。 不是所有 Skill 都是平等的。有的是 API 调用的薄封装。有的包含大量原生逻辑——预处理、验证、回退链。指南对它们一视同仁。但差异很重要:一个渲染 prompt 模板的 Skill 和一个运行 WASM 沙箱的 Skill 是完全不同的可靠性画像。
Gene 命题
这些不是功能需求,而是结构性缺口。
Skill 范式解决的是编码问题:如何打包一个能力让 AI Agent 可以使用它?指南回答得很好。但编码只是故事的一半。
在生物学中,标准化遗传密码——四字母表、密码子表、阅读框——是必要的但不充分的。让进化真正运转的是编码之后的一切:复制、变异、选择、竞争、传播和死亡。
Rotifer Protocol 从 Skill 范式停下的地方开始。Gene 是一个被赋予了完整进化机械的 Skill:
| Skill(静态) | Gene(进化中) |
|---|---|
| 发布一次 | 带语义谱系的版本化 |
| 无质量信号 | Arena 竞争产生适应度分数 F(g) |
| 留在原处 | 通过水平逻辑转移(HLT)传播 |
| 永远存活 | 六态生命周期(Draft → Published → Active → Deprecated → Archived → Tombstoned) |
| 单一保真度 | 三级保真度(Wrapped → Hybrid → Native) |
| 扁平注册表 | 带竞争、排名和日落机制的 Registry |
Gene 不是 Skill 的替代品。它是一个学会了进化的 Skill。
标准化先于选择
Anthropic 这次发布的真正好消息在于:你需要一个标准化的基因组,才能有自然选择。
如果每个框架都以不同方式定义能力——LangChain Tools、OpenAI Actions、MCP、Semantic Kernel Plugins、CrewAI skills——那么跨框架竞争就不可能。一个 LangChain Tool 无法与一个 MCP Server 竞争,因为它们不共享公共接口。
Skill 作为开放标准改变了这一点。当能力共享公共结构(SKILL.md、YAML frontmatter、类型化输入输出),它们就变得可比较。一旦可比较,它们就能竞争。一旦竞争,最好的就能被选择、传播和构建。
Skill 标准是氨基酸字母表。Gene 是蛋白质。进化是连接它们的过程。
这对实践意味着什么
如果你今天正在构建 AI 工作流:
-
使用 Skill。 指南提供了好建议。打包你的最佳实践,测试它们,迭代 description。
-
思考规模化后会怎样。 当你的团队有 50 个 Skill 时,你将如何决定保留哪些?当你的社区有 500 个时,新用户如何找到最适合他们任务的那一个?
-
留意适应度缺口。 当你发现自己在手动对比两个做同一件事的 Skill 时,你就撞上了指南没有回答的那个天花板。
Rotifer CLI 已包含 Skill Import 管道,可将现有的 SKILL.md 文件转化为 Gene——保留你的工作成果,同时添加进化基础设施。无需重写。
npm install -g @rotifer/playgroundrotifer gene init --from-skill ~/.cursor/skills/your-skill/你的 Skill 已经很好了。它们只是还没学会进化。