Andrej Karpathy 的 autoresearch 是近年来最优雅的进化计算演示之一。前提极其简单：给 AI Agent 一个真实的 LLM 训练环境，让它修改代码，训练 5 分钟，评估结果是否改善，保留或丢弃，然后重复。用户去睡觉；Agent 做实验；用户醒来看到一份实验日志和一个更好的模型。

该仓库在 2026 年 3 月发布后几天内突破 39,000 stars。开发者社区的反应是即时且强烈的——不是因为 autoresearch 自动化了超参数调优（很多工具都能做到），而是因为它展示了更根本的东西：自然选择作用于代码，可以在无人干预的情况下产生真正的改进。

本文探讨 autoresearch 与 Rotifer Protocol（一个面向自主软件 Agent 的开源进化框架）之间的结构性平行关系。我们认为，autoresearch 代表了一个出色的垂直进化计算演示，而 Rotifer Protocol 提供了将这一模式泛化到所有 Agent 能力的水平基础设施——关键是，使发现能够在 Agent 之间传播，而非孤立地留在个体实验中。

1. autoresearch 的极简之美

autoresearch 的力量来自化约。整个系统由三个组件构成：

组件	角色	编辑者
`train.py`	可变异单元——包含完整的 GPT 模型、优化器（Muon + AdamW）和训练循环	Agent
`val_bpb`	适应度函数——验证集 bits per byte，越低越好，与词表大小无关	自动计算
`program.md`	宪法文档——给 Agent 的基线指令	人类

Karpathy 的关键设计决策强化了这种简洁性：

单文件修改。 Agent 只修改 train.py。架构、超参数、优化器、batch size——一切都可以改，但一切都在一个文件中。范围受限；diff 可审查。
固定时间预算。 训练始终运行恰好 5 分钟的壁钟时间，无论 Agent 做了什么改动。这使实验直接可比：新架构、不同的 batch size、新颖的优化器——都在相同的时间约束下评估。
自包含。 无分布式训练，无复杂配置。一个 GPU，一个文件，一个指标。

这三个设计选择揭示了进化系统的最小可行结构：

可变异单元 — 可以改变的东西
适应度函数 — 衡量改变好坏的量化标准
不可变约束层 — 进化过程本身不能修改的规则

这种三元结构并非 autoresearch 独有。我们认为，它是一种普遍模式。

2. 孤立问题

autoresearch 的优雅伴随着一个结构性局限：每个实验都是孤立的。

每个用户 fork 仓库，在自己的 GPU 上运行实验，在自己的 train.py 中发现改进。如果旧金山的 Alice 在 H100 上发现某个训练技巧显著降低了 val_bpb，全球其他 5,000 个 fork 不会从中受益——除非 Alice 提交 PR，维护者审查并合并，其他用户再拉取更新。

这不是对 autoresearch 设计的批评。对于单用户 ML 优化工具来说，孤立是合理的简化。但它映射了 HGT 出现之前生物学中的一种模式，这种模式限制了数十亿年的进化速度：有用的变异被锁定在个体谱系内部。

在水平基因转移出现之前的生物进化中，每个有机体都必须独立发现每一种适应。抗生素耐药性、代谢通路、应激反应——每个谱系都在重新发明轮子。进化创新的速率受限于个体有机体的突变率。

3. 轮虫在 4000 万年前就想明白了

蛭形轮虫（Rotifera: Bdelloidea）是微小的淡水无脊椎动物，已有约 4000 万年完全通过无性方式繁殖。按照传统进化理论，这应该是灾难性的——无性繁殖导致 Muller 棘轮效应（有害突变不可逆积累）和对共同进化寄生虫的脆弱性（红皇后假说）。

然而，蛭形轮虫是地球上最具韧性的动物之一。它们的秘密：水平基因转移（HGT）。在干燥诱导的 DNA 损伤和修复过程中，轮虫将其他物种——真菌、细菌甚至植物——的遗传物质直接整合到自己的基因组中。它们表达的基因中，高达 8-10% 来自非后生动物来源，是动物界中记录到的最广泛的 HGT 案例。

轮虫 HGT 的关键特性：

无中央协调者 — 转移通过环境暴露发生，而非定向通信
适应度比例采纳 — 改善生存的基因被保留；中性或有害的获取被选择淘汰
跨物种转移 — 有用基因的来源无关紧要；重要的是它是否有效

结果：4000 万年的韧性、多样性和适应——没有有性繁殖，没有中央规划，没有看门人。

4. 结构性收敛

autoresearch 与 Rotifer Protocol 之间的平行关系不是设计出来的——它是收敛的。两个系统独立地到达了相同的进化原语，因为这些原语是任何利用选择压力进行改进的系统的最低要求：

autoresearch	Rotifer Protocol	共享原理
`train.py`	Gene	可变异单元——原子化、自包含的逻辑
`val_bpb`	F(g) = (S_r × log(1+C_util) × (1+R_rob)) / (L × R_cost)	量化适应度——选择压力
`program.md`	L0 Kernel	不可变约束——宪法层
5 分钟时间预算	Arena	标准化评估环境
Fork	Agent	独立进化实体
实验日志	Gene 谱系 + 版本历史	进化记录

这种收敛验证了一个论断：三元结构（可变异单元 + 适应度函数 + 约束层）是计算进化的普遍最小架构。

5. 集体进化带来什么

Rotifer Protocol 用只有在进化发生在 Agent 网络中时才会涌现的能力，扩展了单 Agent 进化循环：

5.1 水平逻辑迁移（HLT）

在 autoresearch 中，成功的变异留在一个 fork。在 Rotifer Protocol 中，高适应度 Gene 按其适应度分数和作者声誉比例在网络中传播。这是轮虫 HGT 的计算类比：

Agent A 发现了完成任务的更好方法
该方法被封装为具有量化适应度分数的 Gene
其他 Agent 可以发现并采用它：rotifer install gene-name
随着更多 Agent 评估，Gene 的适应度分数不断更新

没有 PR 审核瓶颈。没有合并队列。网络以计算速度而非人类代码审查速度，将好想法路由到需要它的地方。

5.2 跨绑定可移植性

autoresearch 为单个 NVIDIA GPU 设计。Rotifer Protocol 将 Gene 编译为 Rotifer IR（WASM + Gene 感知约束层），通过形式化的能力协商协议，实现跨异构环境执行——云端、边缘、本地。在一个环境中工作的 Gene 可以在执行前自动验证与另一个环境的兼容性。

5.3 多维适应度

autoresearch 使用单一标量指标（val_bpb）。Rotifer Protocol 的适应度函数 F(g) 是一个乘法模型，包含成功率、利用率、鲁棒性、延迟和资源成本。乘法结构确保安全性或可靠性为零的 Gene 会被立即淘汰，无论其他分数如何——当 Gene 在服务真实用户的 Agent 网络中传播时，这一特性变得至关重要。

5.4 集体安全

当进化在隔离中发生（一个用户，一个 GPU），安全是个人关注的问题。当它在网络中发生时，就变成了系统性问题。Rotifer Protocol 通过以下方式解决：

V(g) 安全评分 — 独立于适应度，评估沙箱合规性、资源消耗模式和行为异常
WASM 沙箱隔离 — 每个 Gene 在自己的沙箱环境中执行
L0 不可变约束 — 即使通过自我修改也无法绕过的宪法层
L4 集体免疫（未来）— 当一个 Agent 检测到恶意 Gene 时，整个网络通过广播威胁指纹获得抵抗力

6. 垂直 Demo，水平 Protocol

精确描述二者关系：autoresearch 和 Rotifer Protocol 不是竞争对手。它们在不同的抽象层面运作。

autoresearch 是一个垂直演示 — 证明进化计算在特定高价值领域（ML 训练优化）有效。它的力量来自极致简洁和对单一用例的激光聚焦。它回答的问题是：“AI Agent 能否自主改进 ML 训练代码？”

Rotifer Protocol 是一个水平基础设施层 — 一个定义任何软件能力如何参与进化动力学的协议规范。它回答的问题是：“我们能否构建基础设施，使任何 Agent 能力都能进化、竞争、传播，并被其他 Agent 安全采用？”

autoresearch 证明进化对 train.py 有效。Rotifer Protocol 追问：如果它对 AI Agent 能执行的每个功能都有效呢？而如果一个 Agent 的发现可以自动惠及所有其他 Agent 呢？

7. 结论：从个体实验到集体智慧

Karpathy 的 autoresearch 给开发者社区一种对计算进化的直觉感受：设定好，去睡觉，醒来后一切变得更好。这种直觉——软件可以通过选择压力自我改进——是使一切成为可能的基础洞察。

下一步是让这个过程变成集体的。不只是一个 Agent 在一夜之间改进一个训练脚本，而是一个 Agent 网络持续改进一个能力网络，最好的想法自动传播，最差的被选择淘汰。

从 autoresearch 到集体进化的路径，映射了从孤立有机体到水平基因转移的生物学路径。大自然花了数亿年。在软件中，我们可以有意识地构建这个基础设施。

这就是 Rotifer Protocol 的目标。

参考文献

Karpathy, A. (2026). autoresearch. GitHub. https://github.com/karpathy/autoresearch
Gladyshev, E. A., Meselson, M., & Arkhipova, I. R. (2008). Massive horizontal gene transfer in bdelloid rotifers. Science, 320(5880), 1210-1213.
Boschetti, C., et al. (2012). Biochemical diversification through foreign gene expression in bdelloid rotifers. PLoS Genetics, 8(11), e1003035.
Rotifer Foundation. (2026). Rotifer Protocol Specification. https://rotifer.dev/docs
Rotifer Foundation. (2026). From Skill to Gene: Why AI Agents Need to Evolve. https://rotifer.dev/blog/from-skill-to-gene

Rotifer Protocol 基于 Apache 2.0 + Safety Clause 开源。网站：rotifer.dev。CLI：npm i -g @rotifer/playground。