NVIDIA 刚刚发表了一篇让每个软件工程师都应该停下来思考的论文。他们的系统——AVO（Agentic Variation Operators）——在 Blackwell B200 GPU 上自主运行了 7 天，优化 attention kernel，全程零人工干预。结果：性能超越 NVIDIA 自家的 cuDNN 库 3.5%，超越 FlashAttention-4 达 10.5%。

研究者将他们的理念称为”盲编程”（blind coding）。共同第一作者许冰直言不讳：“盲编程是软件工程的未来。人类认知能力是瓶颈。”

这不是进化式代码搜索第一次超越人类。Google 的 AlphaEvolve 去年在矩阵乘法和 Ramsey 数下界搜索中做到了。但 AVO 将范式推向了更远——而两个系统共享一个深层的结构性限制。

范式演进：AlphaEvolve → AVO

AlphaEvolve（2025）和 AVO（2026）遵循相同的进化模板：

将代码表示为可进化单元 —— 可以被变异的候选解
定义适应度函数 —— 自动化衡量”更好”的方式
施加选择压力 —— 保留最优，淘汰其余
迭代 —— 重复数小时、数天或数周，无需人工干预

差异在于变异步骤的处理方式。AlphaEvolve 使用 LLM 作为候选生成器——逐个提议代码修改。AVO 将 Agent 提升为变异算子本身——它不仅生成候选，还运行一个完整的自主循环：提议、修复、自我批评、验证，然后才将候选提交到种群。

这是一个重要的架构进化。AVO 的 Agent 会查阅前代解的完整血统，阅读硬件文档，分析 profiler 输出，独立迭代。变异步骤本身成为一个智能过程，而非单次生成。

结果不言自明：AVO 发现了人类 GPU 专家从未尝试过的微架构级优化——寄存器重新分配、无分支累加器重缩放、指令流水线重叠。当被指向相关问题（分组查询注意力 GQA）时，Agent 仅用 30 分钟就将 MHA 优化迁移过去。

结构性限制：两者都是封闭系统

AlphaEvolve 和 AVO 共享一个限制其影响力的约束：它们是封闭系统。

每个候选解都由同一个团队生成、评估和消费
适应度函数内置于框架中，不可替换
发现不传播——为 attention kernel 找到的优化留在 NVIDIA 的代码库内
外部开发者无法提交竞争性搜索策略或更好的评估器

这不是批评——对于内部优化来说这是合理的设计选择。但这意味着进化动力学被限制在单一种群、单一评估器和单一环境中。

如果把这一切都开放呢？

开放协议层的模式

一个进化式代码搜索的开放协议大致如下：

组件	封闭系统（AVO/AlphaEvolve）	开放协议
代码单元	内部候选	可发布、有版本、有类型的模块（如 Gene）
适应度评估	内置 profiler	可替换的评估器模块——任何人都能构建更好的
选择机制	内部排名	公开 Arena，透明排名 + 反操纵规则
知识传递	留在一个代码库内	发现在开发者、领域和环境之间传播
血统追踪	隐式（git 历史）	显式衍生图谱 + 归因激励
多样性保护	无（赢家通吃）	频率依赖选择，防止单一文化

这大致就是 Rotifer Protocol 的架构。

在 Rotifer 中，代码单元称为 Gene——自包含、有类型、可适应度评估的模块。它们在公开 Arena 中竞争，双指标系统（适应度 F(g) 衡量效用，验证分 V(g) 衡量安全性）决定存活。Arena 施加选择压力，但多样性因子防止任何单一 Gene 垄断其领域。在一个环境中有效的优化通过**水平逻辑迁移（HLT）**传播到其他环境——这是协议层的跨 Agent、跨领域知识迁移机制。

评估器不是内置的。Rotifer 定义了 Judge Gene 的概念——一种元 Gene，专门评估其他 Gene 的质量。Judge Gene 在自己的 Arena 中竞争，因此评估的质量本身也在进化。这是关键差异：在 AVO 中，NVIDIA 决定什么是”更好”。在开放协议中，社区构建和改进评估器。

AVO 验证了什么

AVO 的结果对任何构建进化式代码基础设施的人都很重要——不是因为具体数字（超越 cuDNN 3.5% 令人印象深刻但属于特定领域），而是因为三个结构性验证：

1. 自主进化可以超越人类专业水平。 AVO 不只是达到了人类表现——它超越了 NVIDIA 最先进硬件上的每一个专家工程实现。这验证了核心论题：基于自主 Agent 的进化搜索可以发现人类工程师无法发现的优化。

2. 血统信息很重要。 AVO 的 Agent 在每次变异前查阅完整的进化历史。这不只是记录保存——它是搜索过程的主动输入。血统引导的变异产生比盲目变异更好的候选。

3. 跨任务迁移有效。 MHA→GQA 的 30 分钟适应证明进化发现不被锁定在特定领域。有了正确的协议基础设施，在一个领域发现的优化可以为另一个领域的搜索提供种子。

这三个发现——超人类性能、血统引导变异、跨任务迁移——独立于特定领域。它们适用于任何代码单元竞争、进化和传播的系统。

时间线

进化式代码搜索正在加速：

2024：FunSearch（DeepMind）—— LLM + 进化搜索发现新的数学构造
2025：AlphaEvolve（DeepMind）—— 打破 Strassen 矩阵乘法 56 年纪录
2026：AVO（NVIDIA）—— 自主 Agent 超越所有人类 GPU 专家

每一步都推向同一个方向：从将 AI 作为人类设计流程内部的工具，到让 AI 成为进化过程本身的算子。

缺失的一环是协议层——让这些能力变得开放、可组合、可集体改进的基础设施。这就是我们正在构建的。

Rotifer Protocol 是一个面向自主软件 Agent 的开源进化框架。协议规范、CLI 和 SDK 可在 rotifer.dev 获取。AVO 论文见 arXiv:2603.24517。