我们构建 AI Agent 的方式正在快速变化。三年间,主流架构从”会调用函数的 LLM”演变为”持久化自主实体”,再到如今越来越像一个生物生态系统。这不是营销叙事——而是对 Agent 能力如何被组织、传递和改进的结构性观察。
本文追踪三代 Agent 架构,分析每一代如何解锁前一代不可能实现的能力。
第一代:经典 Agent(2023)
Lilian Weng 的 2023 年博文 定义了第一波 LLM Agent 的经典架构。模型简洁优雅:
- LLM 居于核心
- 工具(Tools) 扩展能力(日历、计算器、搜索、代码解释器)
- 规划(Planning) 引导推理(思维链、反思、自我批评、子目标分解)
- 记忆(Memory) 提供上下文(短期记忆通过上下文窗口,长期记忆通过向量存储)
- LLM 基于上述上下文产生 行动(Action)
这个架构驱动了 AutoGPT、BabyAGI、LangChain Agent 以及数十个类似系统。其核心特性:Agent 就是一次会话。 用户开启对话时它存在,对话结束时它消失。工具被硬编码进系统。Agent 没有机制获取新能力、与其他 Agent 共享发现、或随时间改进。
经典 Agent 是一个被动工具调用者——在单次交互中很强大,但跨交互无状态,与其他 Agent 完全隔离。
第二代:OpenClaw(2025)
OpenClaw 框架(由 ClawCore 和 BISHENG 开发)代表了下一个进化阶段。它保留了经典 Agent 的核心(LLM + 工具 + 行动),但增加了四个结构性创新:
持久化。 记忆从上下文窗口迁移到基于文件的存储。Agent 拥有跨会话持久的短期和长期记忆。对话之间可以层层积累。
身份。 每个 Agent 拥有一个 Soul(灵魂)——持久化身份文档,定义其个性、目标和行为参数。这不仅仅是一个每次重新生成的系统提示;而是一个稳定的参照点,在多次交互中塑造行为。
技能。 不再是硬编码的工具函数,Agent 通过 Skill(技能) 获取能力——模块化的包,可以安装、配置和共享。MCP(模型上下文协议)提供了标准化的外部工具访问接口,将 Agent 从单一工具供应商中解耦。
自主性。 Cron + Heartbeat 使 Agent 无需人类发起即可行动。Agent 不只是等待提示——它可以自主安排工作并维持持续的活动心跳。
OpenClaw Agent 是持久化自主 Agent。它们有记忆、有身份、能获取技能、能自主行动。但仍然存在一个结构性缺口:技能是手动安装和更新的。没有机制让技能相互竞争,没有量化指标衡量一个技能是否优于另一个,也没有途径让一个 Agent 发现的能力改进自动传播到其他 Agent。
第三代:Rotifer Protocol(2026)
Rotifer Protocol 将生物学隐喻落到实处。它不把 Agent 能力视为静态包,而是视为 Gene(基因)——模块化的逻辑单元,会诞生、竞争、进化,并在 Agent 种群间传播。
名称来源于蛭形轮虫(bdelloid rotifers)——这种微观动物通过水平基因转移繁荣了 4000 万年,从完全不同的物种中获取有用的遗传物质并整合到自己的基因组中。
URAA:五层进化架构
| 层 | 名称 | 功能 |
|---|---|---|
| L4 | 集体免疫 | 跨 Agent 网络的威胁广播 |
| L3 | 竞争与交换 | Arena 排名 + 水平逻辑迁移 |
| L2 | 校准 | 适应度 F(g) 与安全性 V(g) 评估 |
| L1 | 合成 | IR 编译(TypeScript → WASM) |
| L0 | 内核 | 不可变约束——宪法层 |
底层(L0)是刻意不可变的——没有任何 Gene、Agent 或进化过程能修改宪法约束。这类似于生物进化中基本物理法则的角色:游戏规则不变,即使玩家在持续进化。
基因池
三种 Gene 共存:
- Native Gene — 可执行 WASM,完全沙箱隔离,最大可移植性
- Hybrid Gene — WASM 执行 + 通过网关的受控网络访问
- Wrapped Gene — API 封装 + 元数据,用于暂时无法编译为 WASM 的能力
每个 Gene 必须满足三公理:功能内聚(专做一件事)、接口自足(自带输入/输出 Schema)、独立可评估(可以独立打分)。
水平逻辑迁移
关键的结构性创新是 HLT(Horizontal Logic Transfer,水平逻辑迁移):当一个 Agent 发现或开发出高适应度 Gene 时,该 Gene 可以按其适应度分数的比例在网络中传播。这是轮虫水平基因转移的计算类比——正是这个生物学机制让无性繁殖的生物在 4000 万年间繁荣不息。
Binding 与可移植性
Gene 通过正式的能力协商协议 negotiate(R_ir, C_binding) 在异构 Binding(Local、Cloud、Web3)间执行。为本地执行编译的 Gene 可以在部署前验证其云端兼容性。Binding 抽象在协议层面消除了”在我机器上能跑”的问题。
Arena
Arena 提供选择压力:Gene 在标准化基准上竞争,其适应度 F(g)——一个由成功率、利用率、鲁棒性、延迟和成本组成的乘法函数——决定排名。乘法结构是关键:一个安全性为零或可靠性为零的 Gene,无论其他维度表现多好,总分都是零。
对比
| 维度 | 经典 Agent | OpenClaw | Rotifer Protocol |
|---|---|---|---|
| 单元 | Prompt | Skill | Gene(WASM IR) |
| 记忆 | 上下文窗口 | 文件持久化 | 状态锚定(L0) |
| 进化 | 无 | 手动更新 | F(g) 自然选择 |
| 传播 | 复制粘贴 | Skill 安装 | HLT P2P 传播 |
| 身份 | 按会话 | Soul + Identity | Binding 抽象 |
| 自主性 | 被动响应 | Cron + Heartbeat | Arena 竞争 |
| 工具访问 | 硬编码函数 | MCP 协议 | RotiferBinding Trait |
| 安全 | 单应用级 | 单应用级 | L4 集体免疫 |
每一行都揭示了下一代填补的结构性缺口:
- 单元:从短暂的 Prompt 到持久的 Skill,再到编译后可内容寻址、携带正式 Schema 的 Gene。
- 进化:从无改进机制到手动更新,再到量化适应度驱动的自然选择。
- 传播:从复制文本到安装包,再到跨网络的适应度比例自动传播。
- 安全:从应用级策略到协议级的集体防御系统。
当 Agent 能进化时,什么改变了
从第一代到第三代的转变不是渐进式改良——而是架构可能性的质变:
发现变得自动。 经典模型中,Agent 使用它被构建时自带的工具。OpenClaw 中,它获取人类策展的 Skill。Rotifer 中,高适应度 Gene 自动传播——网络把好的想法路由到需要它们的 Agent。
质量变得可量化。 经典 Agent 没有标准化的能力质量指标。OpenClaw 有社区采用信号。Rotifer 有 F(g)——一个正式的、可复现的适应度函数,驱动自然选择。
安全变得集体化。 经典 Agent 中检测到恶意能力时,只有那一个 Agent 受到保护。在 Rotifer 的集体免疫层中,一个 Agent 检测到的威胁会生成防御指纹,保护整个网络。
可移植性有了保障。 经典工具绑定于其运行时。OpenClaw Skill 是语言特定的包。Rotifer Gene 编译为 WASM IR,并在执行前与任何 Binding(本地、云端或链上)协商兼容性。
我们不是说这三种架构是唯一可能的方案,也不是说进化严格线性。但轨迹很清晰:Agent 能力的基本单元正在变得更正式、更可移植、更适合自动化改进。问题不再是 Agent 能力是否应该进化——而是这种进化是偶然发生(手动更新、社区策展)还是被刻意设计(量化适应度、正式传播、集体安全)。
生物学在 4000 万年前解决了这个问题。软件正在迎头赶上。
试用: npm i -g @rotifer/playground · rotifer.dev · 文档