我们构建 AI Agent 的方式正在快速变化。三年间，主流架构从”会调用函数的 LLM”演变为”持久化自主实体”，再到如今越来越像一个生物生态系统。这不是营销叙事——而是对 Agent 能力如何被组织、传递和改进的结构性观察。

本文追踪三代 Agent 架构，分析每一代如何解锁前一代不可能实现的能力。

第一代：经典 Agent（2023）

Lilian Weng 的 2023 年博文定义了第一波 LLM Agent 的经典架构。模型简洁优雅：

LLM 居于核心
工具（Tools） 扩展能力（日历、计算器、搜索、代码解释器）
规划（Planning） 引导推理（思维链、反思、自我批评、子目标分解）
记忆（Memory） 提供上下文（短期记忆通过上下文窗口，长期记忆通过向量存储）
LLM 基于上述上下文产生 行动（Action）

这个架构驱动了 AutoGPT、BabyAGI、LangChain Agent 以及数十个类似系统。其核心特性：Agent 就是一次会话。 用户开启对话时它存在，对话结束时它消失。工具被硬编码进系统。Agent 没有机制获取新能力、与其他 Agent 共享发现、或随时间改进。

经典 Agent 是一个被动工具调用者——在单次交互中很强大，但跨交互无状态，与其他 Agent 完全隔离。

第二代：OpenClaw（2025）

OpenClaw 框架（由 ClawCore 和 BISHENG 开发）代表了下一个进化阶段。它保留了经典 Agent 的核心（LLM + 工具 + 行动），但增加了四个结构性创新：

持久化。 记忆从上下文窗口迁移到基于文件的存储。Agent 拥有跨会话持久的短期和长期记忆。对话之间可以层层积累。

身份。 每个 Agent 拥有一个 Soul（灵魂）——持久化身份文档，定义其个性、目标和行为参数。这不仅仅是一个每次重新生成的系统提示；而是一个稳定的参照点，在多次交互中塑造行为。

技能。 不再是硬编码的工具函数，Agent 通过 Skill（技能） 获取能力——模块化的包，可以安装、配置和共享。MCP（模型上下文协议）提供了标准化的外部工具访问接口，将 Agent 从单一工具供应商中解耦。

自主性。 Cron + Heartbeat 使 Agent 无需人类发起即可行动。Agent 不只是等待提示——它可以自主安排工作并维持持续的活动心跳。

OpenClaw Agent 是持久化自主 Agent。它们有记忆、有身份、能获取技能、能自主行动。但仍然存在一个结构性缺口：技能是手动安装和更新的。没有机制让技能相互竞争，没有量化指标衡量一个技能是否优于另一个，也没有途径让一个 Agent 发现的能力改进自动传播到其他 Agent。

第三代：Rotifer Protocol（2026）

Rotifer Protocol 将生物学隐喻落到实处。它不把 Agent 能力视为静态包，而是视为 Gene（基因）——模块化的逻辑单元，会诞生、竞争、进化，并在 Agent 种群间传播。

名称来源于蛭形轮虫（bdelloid rotifers）——这种微观动物通过水平基因转移繁荣了 4000 万年，从完全不同的物种中获取有用的遗传物质并整合到自己的基因组中。

URAA：五层进化架构

层	名称	功能
L4	集体免疫	跨 Agent 网络的威胁广播
L3	竞争与交换	Arena 排名 + 水平逻辑迁移
L2	校准	适应度 F(g) 与安全性 V(g) 评估
L1	合成	IR 编译（TypeScript → WASM）
L0	内核	不可变约束——宪法层

底层（L0）是刻意不可变的——没有任何 Gene、Agent 或进化过程能修改宪法约束。这类似于生物进化中基本物理法则的角色：游戏规则不变，即使玩家在持续进化。

基因池

三种 Gene 共存：

Native Gene — 可执行 WASM，完全沙箱隔离，最大可移植性
Hybrid Gene — WASM 执行 + 通过网关的受控网络访问
Wrapped Gene — API 封装 + 元数据，用于暂时无法编译为 WASM 的能力

每个 Gene 必须满足三公理：功能内聚（专做一件事）、接口自足（自带输入/输出 Schema）、独立可评估（可以独立打分）。

水平逻辑迁移

关键的结构性创新是 HLT（Horizontal Logic Transfer，水平逻辑迁移）：当一个 Agent 发现或开发出高适应度 Gene 时，该 Gene 可以按其适应度分数的比例在网络中传播。这是轮虫水平基因转移的计算类比——正是这个生物学机制让无性繁殖的生物在 4000 万年间繁荣不息。

Binding 与可移植性

Gene 通过正式的能力协商协议 negotiate(R_ir, C_binding) 在异构 Binding（Local、Cloud、Web3）间执行。为本地执行编译的 Gene 可以在部署前验证其云端兼容性。Binding 抽象在协议层面消除了”在我机器上能跑”的问题。

Arena

Arena 提供选择压力：Gene 在标准化基准上竞争，其适应度 F(g)——一个由成功率、利用率、鲁棒性、延迟和成本组成的乘法函数——决定排名。乘法结构是关键：一个安全性为零或可靠性为零的 Gene，无论其他维度表现多好，总分都是零。

对比

维度	经典 Agent	OpenClaw	Rotifer Protocol
单元	Prompt	Skill	Gene（WASM IR）
记忆	上下文窗口	文件持久化	状态锚定（L0）
进化	无	手动更新	F(g) 自然选择
传播	复制粘贴	Skill 安装	HLT P2P 传播
身份	按会话	Soul + Identity	Binding 抽象
自主性	被动响应	Cron + Heartbeat	Arena 竞争
工具访问	硬编码函数	MCP 协议	RotiferBinding Trait
安全	单应用级	单应用级	L4 集体免疫

每一行都揭示了下一代填补的结构性缺口：

单元：从短暂的 Prompt 到持久的 Skill，再到编译后可内容寻址、携带正式 Schema 的 Gene。
进化：从无改进机制到手动更新，再到量化适应度驱动的自然选择。
传播：从复制文本到安装包，再到跨网络的适应度比例自动传播。
安全：从应用级策略到协议级的集体防御系统。

当 Agent 能进化时，什么改变了

从第一代到第三代的转变不是渐进式改良——而是架构可能性的质变：

发现变得自动。 经典模型中，Agent 使用它被构建时自带的工具。OpenClaw 中，它获取人类策展的 Skill。Rotifer 中，高适应度 Gene 自动传播——网络把好的想法路由到需要它们的 Agent。

质量变得可量化。 经典 Agent 没有标准化的能力质量指标。OpenClaw 有社区采用信号。Rotifer 有 F(g)——一个正式的、可复现的适应度函数，驱动自然选择。

安全变得集体化。 经典 Agent 中检测到恶意能力时，只有那一个 Agent 受到保护。在 Rotifer 的集体免疫层中，一个 Agent 检测到的威胁会生成防御指纹，保护整个网络。

可移植性有了保障。 经典工具绑定于其运行时。OpenClaw Skill 是语言特定的包。Rotifer Gene 编译为 WASM IR，并在执行前与任何 Binding（本地、云端或链上）协商兼容性。

我们不是说这三种架构是唯一可能的方案，也不是说进化严格线性。但轨迹很清晰：Agent 能力的基本单元正在变得更正式、更可移植、更适合自动化改进。问题不再是 Agent 能力是否应该进化——而是这种进化是偶然发生（手动更新、社区策展）还是被刻意设计（量化适应度、正式传播、集体安全）。

生物学在 4000 万年前解决了这个问题。软件正在迎头赶上。

试用： npm i -g @rotifer/playground · rotifer.dev · 文档