← 返回博客

进化工程:AI 中缺失的学科

Prompt Engineering 教 AI 如何倾听,Context Engineering 教它知道什么,Harness Engineering 教它如何行动。但谁来定义 AI「能做什么」——以及这些能力如何改进?一个关于下一个工程范式的论点。

进化工程:AI 中缺失的学科

Prompt Engineering 教 AI 如何倾听。Context Engineering 教它知道什么。Harness Engineering 教它如何行动。每个范式解决了 AI 技术栈的一个真实层面——每个也都留下了一层没碰。

那一层是能力本身。不是你如何与 AI 对话,不是 AI 知道什么,不是 AI 如何被编排——而是 AI 能做什么,以及这些能力如何随时间改进。

本文论证这个空白定义了一个新的工程学科。我们称之为 Evolution Engineering(进化工程)


四个层次

要理解这个空白,先回溯这个演进:

Prompt Engineering(2022–2024) 解决了接口问题。LLM 对措辞敏感——同一个问题用不同方式问,输出天差地别。Prompt Engineering 发展出一系列技术(思维链、少样本、系统提示),让 LLM 的回答变得可靠且有用。工作单元是 prompt

Context Engineering(2025) 解决了知识问题。光有 prompt 不够——模型需要在正确的时间获得正确的信息。Context Engineering 管理整个上下文窗口:RAG 管线、记忆系统、工具调用结果、对话历史。工作单元是 context window。Andrej Karpathy 说得好:“我不会说 prompt engineering 有多重要。真正重要的是 context engineering。”

Harness Engineering(2025–2026) 解决了编排问题。Context 告诉 AI 该知道什么;Harness 告诉 AI 如何行动。Harness 系统协调多步骤 Agent 工作流、管理工具调用、处理错误恢复,确保 Agent 在生产环境中可靠执行。工作单元是 agent harness——将 LLM 从推理引擎变为行动实体的脚手架。

每个范式都有价值。每个都是必要的。每个都共存——Context Engineering 没有消灭 Prompt Engineering;Harness Engineering 没有消灭 Context Engineering。它们叠加。

但注意缺了什么。


空白

谁来定义 AI 能做什么

今天的答案是:人类,手动定义。 开发者写一个工具函数。团队打包一个 Skill。工程师硬编码一个 API 包装器。这些能力是手工制作的,在创建时刻冻结,通过手动更新维护。

这在小规模下可以工作。当以下情况出现时就不行了:

根本原因是结构性的:我们把 AI 能力当作静态制品来管理,而不是当作活的单元来培育。

Prompt Engineering 给了 AI 耳朵。Context Engineering 给了 AI 记忆。Harness Engineering 给了 AI 双手。但没人给 AI DNA——一种让能力可以诞生、测试、筛选、转移和进化的机制。


论点:Evolution Engineering

Evolution Engineering 是这样一门学科:设计让 AI 能力通过进化机制改进的系统,而非依赖手动工程。

核心洞察:不是亲手构建每个能力,而是设计选择环境——适应度标准、竞争竞技场、传播通道、安全免疫系统——让能力在其中进化。

这不是比喻。它是 40 亿年生物适应同一原理的直接应用,为软件工程操作化。

它意味着的转变:

传统方式Evolution Engineering
能力如何改进开发者重写代码适应度驱动的选择淘汰落后者
能力如何传播手动安装/复制高适应度模块自动传播
质量如何衡量主观判断(“对我管用”)量化适应度函数 F(g)
安全如何运作逐应用策略集体免疫系统
从业者的工作构建能力设计选择环境

最后一行是关键。Evolution Engineer 不需要从零手写每个能力。他们设计游戏规则——适应度意味着什么、竞争如何运作、安全阈值必须达到什么标准——能力在这些规则内涌现、竞争和改进。

这镜像了其他工程学科的模式。DevOps 没有取代开发——它围绕基础设施创造了新学科。MLOps 没有取代机器学习——它围绕模型生命周期创造了新学科。Evolution Engineering 没有取代 Prompt/Context/Harness Engineering——它围绕能力生命周期创造了新学科。


让它形式化

没有形式化的范式只是品牌营销。Evolution Engineering 建立在四个形式化支柱上:

1. Gene:原子能力单元

Gene 是最小的可转移逻辑单元。它满足三条公理:

形式化地,一个 Gene g 由以下元组定义:

g=(id,express,phenotype,healthCheck)g = (id, \text{express}, \text{phenotype}, \text{healthCheck})

其中 id = H(content(g)) 是内容寻址哈希,express: Context → Result 是执行函数,phenotype 声明能力和约束,healthCheck 提供自诊断。

内容寻址意味着身份由行为决定,而非名称或作者。两个开发者独立编写相同逻辑会产生相同的 Gene。

2. 适应度函数:量化选择压力

每个 Gene 由比率制适应度函数评分:

F(g)=Srlog(1+Cutil)(1+Rrob)LRcostF(g) = \frac{S_r \cdot \log(1 + C_{util}) \cdot (1 + R_{rob})}{L \cdot R_{cost}}

其中 S_r 是成功率,C_util 是输入空间覆盖率,R_rob 是对抗性输入的鲁棒性,L 是延迟,R_cost 是资源成本。

乘法结构是刻意的:一个零可靠性或零安全性的 Gene 总分为零,无论其他维度多优秀。不存在”快但坏”——函数强制全维度质量。

安全性通过独立的验证分数 V(g) 评估,构成两道独立防线。Gene 必须同时超过两个阈值才能被准入。

3. Arena:竞争即选择

同一功能域的 Gene 在标准化基准上竞争。Arena 提供驱动进化的选择压力:

这是计算性自然选择。不是人工策展,不是人气投票——而是适应度按比例的选择。

4. 水平逻辑迁移:跨 Agent 传播

当一个 Agent 发现或开发出高适应度 Gene 时,该 Gene 可以传播给需要相同能力的其他 Agent。迁移与适应度成正比——更好的 Gene 传播更快。

这个机制直接受到 bdelloid 轮虫的水平基因转移(HGT) 启发——这种微型动物在 4000 万年的无性繁殖中,通过从其他物种获取遗传物质而蓬勃发展。其表达基因中有高达 10% 来自非后生动物来源。这不是比喻——这是结构同构:Gene 模型、适应度比例传播、集体免疫系统都直接映射到经 40 亿年进化验证的生物学机制。


Evolution Engineering 不是什么

不是 AutoML。 AutoML 在固定训练循环内优化模型超参数和架构。Evolution Engineering 运作在能力层——在模型之上,在 Agent 用推理能力做什么的层面。

不是 Meta-Learning。 Meta-learning 训练模型在新任务上更快学习。Evolution Engineering 完全不修改模型——它进化的是 Agent 组合来解决问题的模块化能力。

不是自我改进 Agent(Voyager、ADA)。自我改进系统让单个 Agent 改善自己的行为。Evolution Engineering 在种群层面运作——改进跨 Agent 传播,创造集体智慧而非孤立的自我优化。

不是其他范式的替代品。 你仍然需要好的 prompt、精心管理的 context、以及健壮的 harness 系统。Evolution Engineering 增加一层;它不减少一层。

区分性特征:模块化能力单元(不是单体模型)、量化适应度(不是主观评估)、跨 Agent 传播(不是孤立改进)、形式化安全评分(不是逐应用信任)。


当前状态:一个论点,还不是范式

知识诚实要求承认目前的位置。

Evolution Engineering 今天是一个由一个实现支撑的论点——Rotifer Protocol,一个开源框架,拥有形式化规范、基于 WASM 的中间表示、50+ 个 Gene、以及用于竞争评估的 Arena。形式化基础是扎实的:经同行审查的 v2.9 规范、五层架构(URAA)、内容寻址的 Gene 身份、比率制适应度、以及具有已证明安全属性的形式化组合代数。

但一个论点要变成范式,需要:

  1. 外部开发者 独立创建 Gene 并在 Arena 中竞争——生态自我验证,而非仅框架作者验证
  2. 至少一个有说服力的案例 证明进化产生的能力在真实任务上优于手工工程的能力
  3. 术语被更广泛采纳 ——当 Rotifer 之外的从业者开始用”能力的适应度函数”和”选择环境”思考问题

我们在 0.5 阶段。基础已建成。论证是自洽的。生物学先例有 40 亿年之深。但生态层面的验证在我们前方,不在身后。


一个邀请

如果这个论点成立,未来几年我们思考 AI 能力的方式将发生转变。从业者不再问”我如何构建这个能力?“,而是问”我如何设计一个让这个能力进化出来的选择环境?”

如果它不成立,它引入的形式化工具——量化适应度评分、内容寻址的能力模块、结构化传播——仍然独立有用。

无论如何,空白是真实的:没有人在系统性地解决 AI 能力如何随时间改进。Evolution Engineering 是一个答案。我们认为它是对的。我们准备好接受挑战。

Terminal window
npm install -g @rotifer/playground
rotifer search --domain "content"

链接: