Prompt Engineering 教 AI 如何倾听。Context Engineering 教它知道什么。Harness Engineering 教它如何行动。每个范式解决了 AI 技术栈的一个真实层面——每个也都留下了一层没碰。
那一层是能力本身。不是你如何与 AI 对话,不是 AI 知道什么,不是 AI 如何被编排——而是 AI 能做什么,以及这些能力如何随时间改进。
本文论证这个空白定义了一个新的工程学科。我们称之为 Evolution Engineering(进化工程)。
四个层次
要理解这个空白,先回溯这个演进:
Prompt Engineering(2022–2024) 解决了接口问题。LLM 对措辞敏感——同一个问题用不同方式问,输出天差地别。Prompt Engineering 发展出一系列技术(思维链、少样本、系统提示),让 LLM 的回答变得可靠且有用。工作单元是 prompt。
Context Engineering(2025) 解决了知识问题。光有 prompt 不够——模型需要在正确的时间获得正确的信息。Context Engineering 管理整个上下文窗口:RAG 管线、记忆系统、工具调用结果、对话历史。工作单元是 context window。Andrej Karpathy 说得好:“我不会说 prompt engineering 有多重要。真正重要的是 context engineering。”
Harness Engineering(2025–2026) 解决了编排问题。Context 告诉 AI 该知道什么;Harness 告诉 AI 如何行动。Harness 系统协调多步骤 Agent 工作流、管理工具调用、处理错误恢复,确保 Agent 在生产环境中可靠执行。工作单元是 agent harness——将 LLM 从推理引擎变为行动实体的脚手架。
每个范式都有价值。每个都是必要的。每个都共存——Context Engineering 没有消灭 Prompt Engineering;Harness Engineering 没有消灭 Context Engineering。它们叠加。
但注意缺了什么。
空白
谁来定义 AI 能做什么?
今天的答案是:人类,手动定义。 开发者写一个工具函数。团队打包一个 Skill。工程师硬编码一个 API 包装器。这些能力是手工制作的,在创建时刻冻结,通过手动更新维护。
这在小规模下可以工作。当以下情况出现时就不行了:
- 你有数百个能力模块,却没有量化方法知道哪个版本的”文档摘要”实际表现最好
- 一个 Agent 发现的改进无法传播给需要相同能力的其他 Agent
- 恶意或低质量的能力模块在生产环境运行前没有正式评估门控
- 上个月有效的能力因上游 API 变化而静默退化,没有任何机制检测到漂移
根本原因是结构性的:我们把 AI 能力当作静态制品来管理,而不是当作活的单元来培育。
Prompt Engineering 给了 AI 耳朵。Context Engineering 给了 AI 记忆。Harness Engineering 给了 AI 双手。但没人给 AI DNA——一种让能力可以诞生、测试、筛选、转移和进化的机制。
论点:Evolution Engineering
Evolution Engineering 是这样一门学科:设计让 AI 能力通过进化机制改进的系统,而非依赖手动工程。
核心洞察:不是亲手构建每个能力,而是设计选择环境——适应度标准、竞争竞技场、传播通道、安全免疫系统——让能力在其中进化。
这不是比喻。它是 40 亿年生物适应同一原理的直接应用,为软件工程操作化。
它意味着的转变:
| 传统方式 | Evolution Engineering | |
|---|---|---|
| 能力如何改进 | 开发者重写代码 | 适应度驱动的选择淘汰落后者 |
| 能力如何传播 | 手动安装/复制 | 高适应度模块自动传播 |
| 质量如何衡量 | 主观判断(“对我管用”) | 量化适应度函数 F(g) |
| 安全如何运作 | 逐应用策略 | 集体免疫系统 |
| 从业者的工作 | 构建能力 | 设计选择环境 |
最后一行是关键。Evolution Engineer 不需要从零手写每个能力。他们设计游戏规则——适应度意味着什么、竞争如何运作、安全阈值必须达到什么标准——能力在这些规则内涌现、竞争和改进。
这镜像了其他工程学科的模式。DevOps 没有取代开发——它围绕基础设施创造了新学科。MLOps 没有取代机器学习——它围绕模型生命周期创造了新学科。Evolution Engineering 没有取代 Prompt/Context/Harness Engineering——它围绕能力生命周期创造了新学科。
让它形式化
没有形式化的范式只是品牌营销。Evolution Engineering 建立在四个形式化支柱上:
1. Gene:原子能力单元
Gene 是最小的可转移逻辑单元。它满足三条公理:
- 功能内聚 — 解决一个原子问题
- 接口自足 — 仅通过声明式 schema(Phenotype)交互
- 独立可评估 — 其适应度和安全性可以在隔离环境中评分,无需依赖其他模块
形式化地,一个 Gene g 由以下元组定义:
其中 id = H(content(g)) 是内容寻址哈希,express: Context → Result 是执行函数,phenotype 声明能力和约束,healthCheck 提供自诊断。
内容寻址意味着身份由行为决定,而非名称或作者。两个开发者独立编写相同逻辑会产生相同的 Gene。
2. 适应度函数:量化选择压力
每个 Gene 由比率制适应度函数评分:
其中 S_r 是成功率,C_util 是输入空间覆盖率,R_rob 是对抗性输入的鲁棒性,L 是延迟,R_cost 是资源成本。
乘法结构是刻意的:一个零可靠性或零安全性的 Gene 总分为零,无论其他维度多优秀。不存在”快但坏”——函数强制全维度质量。
安全性通过独立的验证分数 V(g) 评估,构成两道独立防线。Gene 必须同时超过两个阈值才能被准入。
3. Arena:竞争即选择
同一功能域的 Gene 在标准化基准上竞争。Arena 提供驱动进化的选择压力:
- 相同输入、相同评估标准、盲测比较
- 高分者自动浮出水面
- 低于准入阈值者退出生态
- 排名随新挑战者进入而持续更新
这是计算性自然选择。不是人工策展,不是人气投票——而是适应度按比例的选择。
4. 水平逻辑迁移:跨 Agent 传播
当一个 Agent 发现或开发出高适应度 Gene 时,该 Gene 可以传播给需要相同能力的其他 Agent。迁移与适应度成正比——更好的 Gene 传播更快。
这个机制直接受到 bdelloid 轮虫的水平基因转移(HGT) 启发——这种微型动物在 4000 万年的无性繁殖中,通过从其他物种获取遗传物质而蓬勃发展。其表达基因中有高达 10% 来自非后生动物来源。这不是比喻——这是结构同构:Gene 模型、适应度比例传播、集体免疫系统都直接映射到经 40 亿年进化验证的生物学机制。
Evolution Engineering 不是什么
不是 AutoML。 AutoML 在固定训练循环内优化模型超参数和架构。Evolution Engineering 运作在能力层——在模型之上,在 Agent 用推理能力做什么的层面。
不是 Meta-Learning。 Meta-learning 训练模型在新任务上更快学习。Evolution Engineering 完全不修改模型——它进化的是 Agent 组合来解决问题的模块化能力。
不是自我改进 Agent(Voyager、ADA)。自我改进系统让单个 Agent 改善自己的行为。Evolution Engineering 在种群层面运作——改进跨 Agent 传播,创造集体智慧而非孤立的自我优化。
不是其他范式的替代品。 你仍然需要好的 prompt、精心管理的 context、以及健壮的 harness 系统。Evolution Engineering 增加一层;它不减少一层。
区分性特征:模块化能力单元(不是单体模型)、量化适应度(不是主观评估)、跨 Agent 传播(不是孤立改进)、形式化安全评分(不是逐应用信任)。
当前状态:一个论点,还不是范式
知识诚实要求承认目前的位置。
Evolution Engineering 今天是一个由一个实现支撑的论点——Rotifer Protocol,一个开源框架,拥有形式化规范、基于 WASM 的中间表示、50+ 个 Gene、以及用于竞争评估的 Arena。形式化基础是扎实的:经同行审查的 v2.9 规范、五层架构(URAA)、内容寻址的 Gene 身份、比率制适应度、以及具有已证明安全属性的形式化组合代数。
但一个论点要变成范式,需要:
- 外部开发者 独立创建 Gene 并在 Arena 中竞争——生态自我验证,而非仅框架作者验证
- 至少一个有说服力的案例 证明进化产生的能力在真实任务上优于手工工程的能力
- 术语被更广泛采纳 ——当 Rotifer 之外的从业者开始用”能力的适应度函数”和”选择环境”思考问题
我们在 0.5 阶段。基础已建成。论证是自洽的。生物学先例有 40 亿年之深。但生态层面的验证在我们前方,不在身后。
一个邀请
如果这个论点成立,未来几年我们思考 AI 能力的方式将发生转变。从业者不再问”我如何构建这个能力?“,而是问”我如何设计一个让这个能力进化出来的选择环境?”
如果它不成立,它引入的形式化工具——量化适应度评分、内容寻址的能力模块、结构化传播——仍然独立有用。
无论如何,空白是真实的:没有人在系统性地解决 AI 能力如何随时间改进。Evolution Engineering 是一个答案。我们认为它是对的。我们准备好接受挑战。
npm install -g @rotifer/playgroundrotifer search --domain "content"链接:
- rotifer.dev — 框架与文档
- rotifer.ai — Gene 市场
- Specification — 形式化协议规范
- GitHub — 所有仓库