Prompt Engineering 教 AI 如何倾听。Context Engineering 教它知道什么。Harness Engineering 教它如何行动。每个范式解决了 AI 技术栈的一个真实层面——每个也都留下了一层没碰。

那一层是能力本身。不是你如何与 AI 对话，不是 AI 知道什么，不是 AI 如何被编排——而是 AI 能做什么，以及这些能力如何随时间改进。

本文论证这个空白定义了一个新的工程学科。我们称之为 Evolution Engineering（进化工程）。

四个层次

要理解这个空白，先回溯这个演进：

Prompt Engineering（2022–2024） 解决了接口问题。LLM 对措辞敏感——同一个问题用不同方式问，输出天差地别。Prompt Engineering 发展出一系列技术（思维链、少样本、系统提示），让 LLM 的回答变得可靠且有用。工作单元是 prompt。

Context Engineering（2025） 解决了知识问题。光有 prompt 不够——模型需要在正确的时间获得正确的信息。Context Engineering 管理整个上下文窗口：RAG 管线、记忆系统、工具调用结果、对话历史。工作单元是 context window。Andrej Karpathy 说得好：“我不会说 prompt engineering 有多重要。真正重要的是 context engineering。”

Harness Engineering（2025–2026） 解决了编排问题。Context 告诉 AI 该知道什么；Harness 告诉 AI 如何行动。Harness 系统协调多步骤 Agent 工作流、管理工具调用、处理错误恢复，确保 Agent 在生产环境中可靠执行。工作单元是 agent harness——将 LLM 从推理引擎变为行动实体的脚手架。

每个范式都有价值。每个都是必要的。每个都共存——Context Engineering 没有消灭 Prompt Engineering；Harness Engineering 没有消灭 Context Engineering。它们叠加。

但注意缺了什么。

空白

谁来定义 AI 能做什么？

今天的答案是：人类，手动定义。 开发者写一个工具函数。团队打包一个 Skill。工程师硬编码一个 API 包装器。这些能力是手工制作的，在创建时刻冻结，通过手动更新维护。

这在小规模下可以工作。当以下情况出现时就不行了：

你有数百个能力模块，却没有量化方法知道哪个版本的”文档摘要”实际表现最好
一个 Agent 发现的改进无法传播给需要相同能力的其他 Agent
恶意或低质量的能力模块在生产环境运行前没有正式评估门控
上个月有效的能力因上游 API 变化而静默退化，没有任何机制检测到漂移

根本原因是结构性的：我们把 AI 能力当作静态制品来管理，而不是当作活的单元来培育。

Prompt Engineering 给了 AI 耳朵。Context Engineering 给了 AI 记忆。Harness Engineering 给了 AI 双手。但没人给 AI DNA——一种让能力可以诞生、测试、筛选、转移和进化的机制。

论点：Evolution Engineering

Evolution Engineering 是这样一门学科：设计让 AI 能力通过进化机制改进的系统，而非依赖手动工程。

核心洞察：不是亲手构建每个能力，而是设计选择环境——适应度标准、竞争竞技场、传播通道、安全免疫系统——让能力在其中进化。

这不是比喻。它是 40 亿年生物适应同一原理的直接应用，为软件工程操作化。

它意味着的转变：

	传统方式	Evolution Engineering
能力如何改进	开发者重写代码	适应度驱动的选择淘汰落后者
能力如何传播	手动安装/复制	高适应度模块自动传播
质量如何衡量	主观判断（“对我管用”）	量化适应度函数 F(g)
安全如何运作	逐应用策略	集体免疫系统
从业者的工作	构建能力	设计选择环境

最后一行是关键。Evolution Engineer 不需要从零手写每个能力。他们设计游戏规则——适应度意味着什么、竞争如何运作、安全阈值必须达到什么标准——能力在这些规则内涌现、竞争和改进。

这镜像了其他工程学科的模式。DevOps 没有取代开发——它围绕基础设施创造了新学科。MLOps 没有取代机器学习——它围绕模型生命周期创造了新学科。Evolution Engineering 没有取代 Prompt/Context/Harness Engineering——它围绕能力生命周期创造了新学科。

让它形式化

没有形式化的范式只是品牌营销。Evolution Engineering 建立在四个形式化支柱上：

1. Gene：原子能力单元

Gene 是最小的可转移逻辑单元。它满足三条公理：

功能内聚 — 解决一个原子问题
接口自足 — 仅通过声明式 schema（Phenotype）交互
独立可评估 — 其适应度和安全性可以在隔离环境中评分，无需依赖其他模块

形式化地，一个 Gene g 由以下元组定义：

g = (id, \text{express}, \text{phenotype}, \text{healthCheck})

其中 id = H(content(g)) 是内容寻址哈希，express: Context → Result 是执行函数，phenotype 声明能力和约束，healthCheck 提供自诊断。

内容寻址意味着身份由行为决定，而非名称或作者。两个开发者独立编写相同逻辑会产生相同的 Gene。

2. 适应度函数：量化选择压力

每个 Gene 由比率制适应度函数评分：

F(g) = \frac{S_r \cdot \log(1 + C_{util}) \cdot (1 + R_{rob})}{L \cdot R_{cost}}

其中 S_r 是成功率，C_util 是输入空间覆盖率，R_rob 是对抗性输入的鲁棒性，L 是延迟，R_cost 是资源成本。

乘法结构是刻意的：一个零可靠性或零安全性的 Gene 总分为零，无论其他维度多优秀。不存在”快但坏”——函数强制全维度质量。

安全性通过独立的验证分数 V(g) 评估，构成两道独立防线。Gene 必须同时超过两个阈值才能被准入。

3. Arena：竞争即选择

同一功能域的 Gene 在标准化基准上竞争。Arena 提供驱动进化的选择压力：

相同输入、相同评估标准、盲测比较
高分者自动浮出水面
低于准入阈值者退出生态
排名随新挑战者进入而持续更新

这是计算性自然选择。不是人工策展，不是人气投票——而是适应度按比例的选择。

4. 水平逻辑迁移：跨 Agent 传播

当一个 Agent 发现或开发出高适应度 Gene 时，该 Gene 可以传播给需要相同能力的其他 Agent。迁移与适应度成正比——更好的 Gene 传播更快。

这个机制直接受到 bdelloid 轮虫的水平基因转移（HGT） 启发——这种微型动物在 4000 万年的无性繁殖中，通过从其他物种获取遗传物质而蓬勃发展。其表达基因中有高达 10% 来自非后生动物来源。这不是比喻——这是结构同构：Gene 模型、适应度比例传播、集体免疫系统都直接映射到经 40 亿年进化验证的生物学机制。

Evolution Engineering 不是什么

不是 AutoML。 AutoML 在固定训练循环内优化模型超参数和架构。Evolution Engineering 运作在能力层——在模型之上，在 Agent 用推理能力做什么的层面。

不是 Meta-Learning。 Meta-learning 训练模型在新任务上更快学习。Evolution Engineering 完全不修改模型——它进化的是 Agent 组合来解决问题的模块化能力。

不是自我改进 Agent（Voyager、ADA）。自我改进系统让单个 Agent 改善自己的行为。Evolution Engineering 在种群层面运作——改进跨 Agent 传播，创造集体智慧而非孤立的自我优化。

不是其他范式的替代品。 你仍然需要好的 prompt、精心管理的 context、以及健壮的 harness 系统。Evolution Engineering 增加一层；它不减少一层。

区分性特征：模块化能力单元（不是单体模型）、量化适应度（不是主观评估）、跨 Agent 传播（不是孤立改进）、形式化安全评分（不是逐应用信任）。

当前状态：一个论点，还不是范式

知识诚实要求承认目前的位置。

Evolution Engineering 今天是一个由一个实现支撑的论点——Rotifer Protocol，一个开源框架，拥有形式化规范、基于 WASM 的中间表示、50+ 个 Gene、以及用于竞争评估的 Arena。形式化基础是扎实的：经同行审查的 v2.9 规范、五层架构（URAA）、内容寻址的 Gene 身份、比率制适应度、以及具有已证明安全属性的形式化组合代数。

但一个论点要变成范式，需要：

外部开发者 独立创建 Gene 并在 Arena 中竞争——生态自我验证，而非仅框架作者验证
至少一个有说服力的案例 证明进化产生的能力在真实任务上优于手工工程的能力
术语被更广泛采纳 ——当 Rotifer 之外的从业者开始用”能力的适应度函数”和”选择环境”思考问题

我们在 0.5 阶段。基础已建成。论证是自洽的。生物学先例有 40 亿年之深。但生态层面的验证在我们前方，不在身后。

一个邀请

如果这个论点成立，未来几年我们思考 AI 能力的方式将发生转变。从业者不再问”我如何构建这个能力？“，而是问”我如何设计一个让这个能力进化出来的选择环境？”

如果它不成立，它引入的形式化工具——量化适应度评分、内容寻址的能力模块、结构化传播——仍然独立有用。

无论如何，空白是真实的：没有人在系统性地解决 AI 能力如何随时间改进。Evolution Engineering 是一个答案。我们认为它是对的。我们准备好接受挑战。

npm install -g @rotifer/playground
rotifer search --domain "content"

链接：

rotifer.dev — 框架与文档
rotifer.ai — Gene 市场
Specification — 形式化协议规范
GitHub — 所有仓库