← 返回博客

大脑不会独自进化——为什么 Agentic LLM 需要进化基础设施

Agentic LLM 越来越聪明。但没有进化压力的智能只会产出静态能力。AI Agent 生态为什么既需要出色的大脑,也需要一个让能力竞争、传播和淘汰的系统。

大脑不会独自进化——为什么 Agentic LLM 需要进化基础设施

AI 行业正处于一场大脑建设军备竞赛中。

每个主要实验室都在投入资源,让模型在工具使用、函数调用、结构化输出和多步推理方面变得更强。成果令人印象深刻——今天的 Agentic LLM 可以在紧凑的循环中规划、执行、观察和反思,这在两年前看起来还像科幻小说。

但有一个没人在问的问题:这些大脑编写和执行的代码,之后怎么了?

当一个 Agent 调用工具、解决问题、或将三个 API 链接在一起时——这段逻辑就消失了。它存在于上下文窗口中,也许被缓存在对话历史里,然后就没了。下一个面对同样问题的 Agent 从零开始。

这就像拥有一群才华横溢的头脑,但他们从不记笔记、从不分享成果、从不在彼此的工作基础上构建。这是没有遗传的进化。


两个层级:模型 vs 协议

有一个有用的区分可以让整个格局变得清晰:

Agentic LLM Rotifer Protocol
本质 模型(权重 / 参数) 基础设施(基因池、适应度评估、跨环境生命周期管理)
角色 决策者、推理引擎、工具执行者 Gene 注册表、竞争 Arena、能力传播
核心单位 权重(训练参数) Gene(能力模块——模块化、可迁移、可评估的代码)
环境 通常驻留在云端推理服务或本地推理机 跨多种环境(Cloud / Web3 / Edge / TEE)
如何改进 重新训练 / 微调(昂贵、缓慢) 自然选择——Gene 在 Arena 中竞争,胜者传播,败者淘汰

这不是两种竞争的方案。它们是同一个系统的不同层级

Agentic LLM 是大脑——负责推理、规划、决定调用哪些工具。Rotifer Protocol 是神经系统——管理哪些能力存在、哪些更优、以及它们如何在 Agent 之间传播。


大脑能给你什么(以及不能给你什么)

现代 Agentic LLM 在三件事上确实令人印象深刻:

1. 可操控性。 你可以通过系统提示词、结构化输出模式和函数调用模板来塾造它们的行为。一个调校良好的 Agentic 模型会以惊人的忠实度遵循 Goal-Observation-Action-Reflection 循环。

2. 即时推理。 给定一个任务和一组工具,一个优秀的 Agentic 模型可以分解问题、选择合适的工具、处理错误并综合结果——在一次推理或短暂的多轮循环中完成。

3. 代码生成。 这些模型可以编写、调试和改进代码。它们可以生成结构化 JSON、组合 API 调用,并按需产出可执行逻辑。

但大脑单独做不到以下事情:

这些不是模型层面的问题。它们是基础设施层面的问题。


进化基础设施能给你什么

Rotifer Protocol 从相反的方向切入这个问题。它不是让单个大脑变得更聪明,而是创建一套让能力模块(称为 Gene)能够竞争、传播和淘汰的基础设施。

核心原语:

Gene ——可迁移逻辑的原子单元。一个 Gene 做一件事:编码一笔交换交易、估算 Gas、解析回执、检测安全模式。Gene 是模块化的(功能内聚)、可移植的(编译为标准中间表示)、且独立可评估的(它的适应度可以不依赖其他 Gene 进行测量)。

Arena ——标准化的竞争环境,解决同一问题的 Gene 在其中进行正面评估。适应度函数 F(g) 综合考量成功率、下游效用、鲁棒性、代码体积和执行成本。持续获胜的 Gene 传播;失败的 Gene 被替代。

Horizontal Logic Transfer (HLT) ——高适应度 Gene 从一个 Agent 传播到其他 Agent 的机制。这是生物学中水平基因转移的数字类比——能力在种群中横向流动,而非仅通过谱系纵向传递。

Binding ——对执行环境的抽象。编译为标准 IR 的 Gene 可以在 Cloud Binding、Web3 Binding 或 Edge Binding 上执行。协议在执行前处理兼容性协商:这个 Gene 的 IR 与这个环境能运行的匹配吗?

Reputation ——Agent 的履历记录,由它所承载的 Gene 的适应度分数和 Arena 参与结果汇总而成。声誉是挚来的,不是声明的。

这些原语都不需要特定的模型。它们适用于任何 LLM(或者完全不需要 LLM——Gene 可以手写、从现有技能库导入、或由自动化管线生成)。


组合:Actor + Environment

最有趣的模式出现在你把这两层组合起来的时候。

LLM 作为 Actor。 Agentic 模型读取任务,决定调用哪些 Gene,编排它们的执行,并观察结果。它是决策者——把意图转化为行动的角色。

协议作为 Environment。 进化协议提供 Gene 注册表(有哪些能力可用)、Arena(它们有多好)、声誉系统(哪些 Agent 值得信任)和传播网络(能力如何扩散)。它是 Actor 运行其上的基底。

在这个组合中:

  1. 模型读取任务,查询 Gene 注册表获取相关能力。
  2. 模型选择并编排 Gene,将它们组合成执行计划(一个 Genome)。
  3. 结果被评估——Arena 的适应度函数更新 Gene 的分数。
  4. 高适应度 Gene 传播至其他 Agent(通过 HLT)。
  5. 低适应度 Gene 被淘汰,由更好的替代方案取代。

模型不需要"知道"进化正在发生。它只需要选择当前最好的工具。协议处理剩下的一切。

而这里有一个让这真正变得有趣的闭环:模型还可以生成新的 Gene。 一个遇到没有好用 Gene 可用的 Agentic LLM 可以合成一个新的,将它提交到 Arena,让自然选择决定它能否存活。大脑变成了变异引擎。协议提供选择压力。


为什么这在现在很重要

三个趋势正在汇聚:

1. Agentic 模型正在商品化。 多个实验室现在都提供具有强大函数调用、结构化输出和多轮推理能力的模型。模型层正在成为基底——强大、可获取、越来越可互换。

2. 能力管理问题未解决。 每个 Agent 框架都在重新发明工具管理、记忆和编排。没有一个共享标准来定义"什么是能力单元、如何评估它、如何在 Agent 之间迁移它"。

3. 单 Agent 智能与多 Agent 进化之间的鸿沟在加大。 单个 Agent 越来越聪明,但生态系统没有让能力积累、竞争和传播的机制。我们在建造越来越好的大脑,但没有神经系统。

问题不是"哪个更强——出色的大脑还是进化系统?"这就像问你更想要神经元还是循环系统。你两个都需要,它们在不同的层级运作。

真正的问题是:谁在建设进化层?


Rotifer Protocol 是一个开源的 AI Agent 进化框架。协议规范、CLI 和 SDK 可在 rotifer.dev 获取。Gene、Arena、Binding 和 HLT 在协议规范中定义。