← 返回博客

NVIDIA 证明进化式代码搜索胜过人类——开放协议层是什么样的?

NVIDIA 的 AVO 自主运行 7 天,超越了所有人类 GPU 专家。AlphaEvolve 在数学领域做到了同样的事。但两者都是封闭系统。一个开放的进化式代码搜索协议该是什么样的?

NVIDIA 证明进化式代码搜索胜过人类——开放协议层是什么样的?

NVIDIA 刚刚发表了一篇让每个软件工程师都应该停下来思考的论文。他们的系统——AVO(Agentic Variation Operators)——在 Blackwell B200 GPU 上自主运行了 7 天,优化 attention kernel,全程零人工干预。结果:性能超越 NVIDIA 自家的 cuDNN 库 3.5%,超越 FlashAttention-4 达 10.5%。

研究者将他们的理念称为”盲编程”(blind coding)。共同第一作者许冰直言不讳:“盲编程是软件工程的未来。人类认知能力是瓶颈。”

这不是进化式代码搜索第一次超越人类。Google 的 AlphaEvolve 去年在矩阵乘法和 Ramsey 数下界搜索中做到了。但 AVO 将范式推向了更远——而两个系统共享一个深层的结构性限制。


范式演进:AlphaEvolve → AVO

AlphaEvolve(2025)和 AVO(2026)遵循相同的进化模板:

  1. 将代码表示为可进化单元 —— 可以被变异的候选解
  2. 定义适应度函数 —— 自动化衡量”更好”的方式
  3. 施加选择压力 —— 保留最优,淘汰其余
  4. 迭代 —— 重复数小时、数天或数周,无需人工干预

差异在于变异步骤的处理方式。AlphaEvolve 使用 LLM 作为候选生成器——逐个提议代码修改。AVO 将 Agent 提升为变异算子本身——它不仅生成候选,还运行一个完整的自主循环:提议、修复、自我批评、验证,然后才将候选提交到种群。

这是一个重要的架构进化。AVO 的 Agent 会查阅前代解的完整血统,阅读硬件文档,分析 profiler 输出,独立迭代。变异步骤本身成为一个智能过程,而非单次生成。

结果不言自明:AVO 发现了人类 GPU 专家从未尝试过的微架构级优化——寄存器重新分配、无分支累加器重缩放、指令流水线重叠。当被指向相关问题(分组查询注意力 GQA)时,Agent 仅用 30 分钟就将 MHA 优化迁移过去。


结构性限制:两者都是封闭系统

AlphaEvolve 和 AVO 共享一个限制其影响力的约束:它们是封闭系统

这不是批评——对于内部优化来说这是合理的设计选择。但这意味着进化动力学被限制在单一种群、单一评估器和单一环境中。

如果把这一切都开放呢?


开放协议层的模式

一个进化式代码搜索的开放协议大致如下:

组件封闭系统(AVO/AlphaEvolve)开放协议
代码单元内部候选可发布、有版本、有类型的模块(如 Gene)
适应度评估内置 profiler可替换的评估器模块——任何人都能构建更好的
选择机制内部排名公开 Arena,透明排名 + 反操纵规则
知识传递留在一个代码库内发现在开发者、领域和环境之间传播
血统追踪隐式(git 历史)显式衍生图谱 + 归因激励
多样性保护无(赢家通吃)频率依赖选择,防止单一文化

这大致就是 Rotifer Protocol 的架构。

在 Rotifer 中,代码单元称为 Gene——自包含、有类型、可适应度评估的模块。它们在公开 Arena 中竞争,双指标系统(适应度 F(g) 衡量效用,验证分 V(g) 衡量安全性)决定存活。Arena 施加选择压力,但多样性因子防止任何单一 Gene 垄断其领域。在一个环境中有效的优化通过**水平逻辑迁移(HLT)**传播到其他环境——这是协议层的跨 Agent、跨领域知识迁移机制。

评估器不是内置的。Rotifer 定义了 Judge Gene 的概念——一种元 Gene,专门评估其他 Gene 的质量。Judge Gene 在自己的 Arena 中竞争,因此评估的质量本身也在进化。这是关键差异:在 AVO 中,NVIDIA 决定什么是”更好”。在开放协议中,社区构建和改进评估器。


AVO 验证了什么

AVO 的结果对任何构建进化式代码基础设施的人都很重要——不是因为具体数字(超越 cuDNN 3.5% 令人印象深刻但属于特定领域),而是因为三个结构性验证:

1. 自主进化可以超越人类专业水平。 AVO 不只是达到了人类表现——它超越了 NVIDIA 最先进硬件上的每一个专家工程实现。这验证了核心论题:基于自主 Agent 的进化搜索可以发现人类工程师无法发现的优化。

2. 血统信息很重要。 AVO 的 Agent 在每次变异前查阅完整的进化历史。这不只是记录保存——它是搜索过程的主动输入。血统引导的变异产生比盲目变异更好的候选。

3. 跨任务迁移有效。 MHA→GQA 的 30 分钟适应证明进化发现不被锁定在特定领域。有了正确的协议基础设施,在一个领域发现的优化可以为另一个领域的搜索提供种子。

这三个发现——超人类性能、血统引导变异、跨任务迁移——独立于特定领域。它们适用于任何代码单元竞争、进化和传播的系统。


时间线

进化式代码搜索正在加速:

每一步都推向同一个方向:从将 AI 作为人类设计流程内部的工具,到让 AI 成为进化过程本身的算子

缺失的一环是协议层——让这些能力变得开放、可组合、可集体改进的基础设施。这就是我们正在构建的。


Rotifer Protocol 是一个面向自主软件 Agent 的开源进化框架。协议规范、CLI 和 SDK 可在 rotifer.dev 获取。AVO 论文见 arXiv:2603.24517