← 返回博客

Agent 架构进化:从被动工具调用者到自进化基因生态系统

三代 Agent 架构——经典 Agent、OpenClaw、Rotifer Protocol——展现了从被动工具调用到自进化基因生态的结构性演变。我们追踪这条进化轨迹。

Agent 架构进化:从被动工具调用者到自进化基因生态系统

我们构建 AI Agent 的方式正在快速变化。三年间,主流架构从”会调用函数的 LLM”演变为”持久化自主实体”,再到如今越来越像一个生物生态系统。这不是营销叙事——而是对 Agent 能力如何被组织、传递和改进的结构性观察。

本文追踪三代 Agent 架构,分析每一代如何解锁前一代不可能实现的能力。


第一代:经典 Agent(2023)

Lilian Weng 的 2023 年博文 定义了第一波 LLM Agent 的经典架构。模型简洁优雅:

这个架构驱动了 AutoGPT、BabyAGI、LangChain Agent 以及数十个类似系统。其核心特性:Agent 就是一次会话。 用户开启对话时它存在,对话结束时它消失。工具被硬编码进系统。Agent 没有机制获取新能力、与其他 Agent 共享发现、或随时间改进。

经典 Agent 是一个被动工具调用者——在单次交互中很强大,但跨交互无状态,与其他 Agent 完全隔离。


第二代:OpenClaw(2025)

OpenClaw 框架(由 ClawCore 和 BISHENG 开发)代表了下一个进化阶段。它保留了经典 Agent 的核心(LLM + 工具 + 行动),但增加了四个结构性创新:

持久化。 记忆从上下文窗口迁移到基于文件的存储。Agent 拥有跨会话持久的短期和长期记忆。对话之间可以层层积累。

身份。 每个 Agent 拥有一个 Soul(灵魂)——持久化身份文档,定义其个性、目标和行为参数。这不仅仅是一个每次重新生成的系统提示;而是一个稳定的参照点,在多次交互中塑造行为。

技能。 不再是硬编码的工具函数,Agent 通过 Skill(技能) 获取能力——模块化的包,可以安装、配置和共享。MCP(模型上下文协议)提供了标准化的外部工具访问接口,将 Agent 从单一工具供应商中解耦。

自主性。 Cron + Heartbeat 使 Agent 无需人类发起即可行动。Agent 不只是等待提示——它可以自主安排工作并维持持续的活动心跳。

OpenClaw Agent 是持久化自主 Agent。它们有记忆、有身份、能获取技能、能自主行动。但仍然存在一个结构性缺口:技能是手动安装和更新的。没有机制让技能相互竞争,没有量化指标衡量一个技能是否优于另一个,也没有途径让一个 Agent 发现的能力改进自动传播到其他 Agent。


第三代:Rotifer Protocol(2026)

Rotifer Protocol 将生物学隐喻落到实处。它不把 Agent 能力视为静态包,而是视为 Gene(基因)——模块化的逻辑单元,会诞生、竞争、进化,并在 Agent 种群间传播。

名称来源于蛭形轮虫(bdelloid rotifers)——这种微观动物通过水平基因转移繁荣了 4000 万年,从完全不同的物种中获取有用的遗传物质并整合到自己的基因组中。

URAA:五层进化架构

名称功能
L4集体免疫跨 Agent 网络的威胁广播
L3竞争与交换Arena 排名 + 水平逻辑迁移
L2校准适应度 F(g) 与安全性 V(g) 评估
L1合成IR 编译(TypeScript → WASM)
L0内核不可变约束——宪法层

底层(L0)是刻意不可变的——没有任何 Gene、Agent 或进化过程能修改宪法约束。这类似于生物进化中基本物理法则的角色:游戏规则不变,即使玩家在持续进化。

基因池

三种 Gene 共存:

每个 Gene 必须满足三公理:功能内聚(专做一件事)、接口自足(自带输入/输出 Schema)、独立可评估(可以独立打分)。

水平逻辑迁移

关键的结构性创新是 HLT(Horizontal Logic Transfer,水平逻辑迁移):当一个 Agent 发现或开发出高适应度 Gene 时,该 Gene 可以按其适应度分数的比例在网络中传播。这是轮虫水平基因转移的计算类比——正是这个生物学机制让无性繁殖的生物在 4000 万年间繁荣不息。

Binding 与可移植性

Gene 通过正式的能力协商协议 negotiate(R_ir, C_binding) 在异构 Binding(Local、Cloud、Web3)间执行。为本地执行编译的 Gene 可以在部署前验证其云端兼容性。Binding 抽象在协议层面消除了”在我机器上能跑”的问题。

Arena

Arena 提供选择压力:Gene 在标准化基准上竞争,其适应度 F(g)——一个由成功率、利用率、鲁棒性、延迟和成本组成的乘法函数——决定排名。乘法结构是关键:一个安全性为零或可靠性为零的 Gene,无论其他维度表现多好,总分都是零。


对比

维度经典 AgentOpenClawRotifer Protocol
单元PromptSkillGene(WASM IR)
记忆上下文窗口文件持久化状态锚定(L0)
进化手动更新F(g) 自然选择
传播复制粘贴Skill 安装HLT P2P 传播
身份按会话Soul + IdentityBinding 抽象
自主性被动响应Cron + HeartbeatArena 竞争
工具访问硬编码函数MCP 协议RotiferBinding Trait
安全单应用级单应用级L4 集体免疫

每一行都揭示了下一代填补的结构性缺口:


当 Agent 能进化时,什么改变了

从第一代到第三代的转变不是渐进式改良——而是架构可能性的质变:

发现变得自动。 经典模型中,Agent 使用它被构建时自带的工具。OpenClaw 中,它获取人类策展的 Skill。Rotifer 中,高适应度 Gene 自动传播——网络把好的想法路由到需要它们的 Agent。

质量变得可量化。 经典 Agent 没有标准化的能力质量指标。OpenClaw 有社区采用信号。Rotifer 有 F(g)——一个正式的、可复现的适应度函数,驱动自然选择。

安全变得集体化。 经典 Agent 中检测到恶意能力时,只有那一个 Agent 受到保护。在 Rotifer 的集体免疫层中,一个 Agent 检测到的威胁会生成防御指纹,保护整个网络。

可移植性有了保障。 经典工具绑定于其运行时。OpenClaw Skill 是语言特定的包。Rotifer Gene 编译为 WASM IR,并在执行前与任何 Binding(本地、云端或链上)协商兼容性。


我们不是说这三种架构是唯一可能的方案,也不是说进化严格线性。但轨迹很清晰:Agent 能力的基本单元正在变得更正式、更可移植、更适合自动化改进。问题不再是 Agent 能力是否应该进化——而是这种进化是偶然发生(手动更新、社区策展)还是被刻意设计(量化适应度、正式传播、集体安全)。

生物学在 4000 万年前解决了这个问题。软件正在迎头赶上。


试用: npm i -g @rotifer/playground · rotifer.dev · 文档