为什么 AI Agent 在链上遭遇障碍

  • Galaxy
  • 发布于 4小时前
  • 阅读 24

文章深入探讨了AI代理在链上操作面临的四大核心挑战:发现摩擦、控制平面摩擦、数据摩擦和执行摩擦。由于区块链底层架构是为人类设计的,缺乏原生的语义解释和经济抽象,AI代理必须开发机器原生的等效功能来替代人类的解释、验证和策略判断。作者认为,缩小这些差距需要开发标准化的经济模式、规范的合约注册表及更智能的执行框架。

加密货币网络最初是为人设计的。而智能体(Agentic)系统必须用机器原生(machine-native)的等效功能来取代人类的解释功能。

导言

AI 智能体(AI agents)的使用场景和能力已经开始演变。它们开始自主执行任务,并被开发用于持有和投资资本、发现交易和收益策略。虽然仍处于实验性转变的早期阶段,但这与过去智能体主要是作为社交和分析工具的发展方向大不相同。

区块链正成为这种演变的天然实验场。它们具有无许可性、可组合性(即同一执行画布承载了所有金融原语的应用)、包含开源应用生态系统、提供对任何参与者都平等访问的数据,并且链上所有资产默认都是可编程的。

这提出了一个结构性问题:如果区块链是可编程且无许可的,为什么自主智能体还会面临摩擦?答案不在于执行是否可能,而在于执行层之上存在多少语义和协调负担。区块链保证了状态转换的正确性,但通常不提供用于经济解释、规范身份或目标级编排的协议原生抽象。

由此产生的摩擦,部分源于无许可系统的架构设计,部分反映了当前工具、策展和市场基础设施的现状。在实践中,许多上层功能仍由包含人类操作环节的软件和工作流来调解。

区块链架构与 AI 智能体

区块链是围绕共识和确定性执行设计的,而非语义解释。它们暴露的是底层原语,如存储插槽事件日志调用追踪,而非标准化的经济对象。因此,诸如头寸、收益率、健康因子和流动性深度等抽象概念,通常由索引器、分析层、前端和 API 在链下重建,将特定协议的状态规范化为更可用的形式。

许多主流的 DeFi 操作流(尤其是零售和决策性操作)仍围绕用户通过前端签署离散交易而组织。这种以 UI 为中心的模式随着零售端的普及而扩展,即使链上活动的很大一部分已经由机器驱动。主要的零售交互模式仍然是:意图 → UI → 交易 → 确认。程序化活动遵循不同的路径,但也有其自身的局限:开发人员在构建时选择合约和资产集,然后在该固定范围内运行算法。这两种模式都无法适应必须相对于不断变化的目标在运行时发现、评估和组合动作的系统。

当针对交易验证优化的基础设施被用于必须解释经济状态、评估信任并针对明确目标优化行动的系统时,摩擦就开始显现。这种差距部分源于区块链的无许可和异构设计,部分反映了目前的工具仍围绕人工审查和前端中介来封装区块链交互。

智能体行动流与传统算法策略

在探讨区块链基础设施与智能体系统之间的差距之前,有必要澄清智能体行动流与传统链上算法系统的区别。

区别不在于自动化、复杂程度、参数化甚至动态适应性。传统算法系统可以高度参数化,自动发现新合约和代币,跨多种策略类型分配,并根据表现进行再平衡。核心区别在于:系统能否处理构建时未预见的情况。

传统算法系统无论多么复杂,都是在执行预先指定的逻辑。它们需要为每种协议类型预定义接口解析器、预定义将合约状态映射到经济含义的评估逻辑、明确的信任和规范性启发式规则,以及为每个决策分支硬编码的规则。当某些内容不匹配预期模式时,系统要么跳过,要么失败。它无法对陌生情况进行推理,只能检查情况是否匹配已知模板。

Digesting Duck 像这只“消化鸭”一样的机械自动化装置可以模仿栩栩如生的行为,但每个动作都是预先设定好的。(《科学美国人》,1899年1月)

扫描新借贷市场的传统算法可以检测到发出熟悉事件或匹配已知工厂模式的部署。但如果出现一个具有陌生接口的新型借贷原语,系统将无法评估它。必须由人类检查合约、理解其机制、决定它是否属于机会集并编写集成逻辑。只有这样,算法才能与其交互。人类负责解释,算法负责执行。基于基础模型(Foundation models)的智能体系统改变了这一边界,它们可以利用习得的推理能力:

  • 解释模糊或未明确指定的目标。 诸如“最大化收益但避免过度风险”的指令需要解释。什么算过度?收益和风险应如何权衡?传统算法需要预先精确定义这些术语。基础模型可以解释意图,应用判断,并根据反馈完善其解释。
  • 泛化到新接口。 智能体可以阅读陌生的合约代码、解析文档或检查从未见过的 ABI(应用二进制接口),并推断系统的经济功能。它不需要为每种协议类型预建解析器。虽然这种能力目前并不完美,但它可以尝试与构建时未预见的系统进行交互。
  • 在信任和规范性的不确定下进行推理。 当信任信号模糊或不完整时,基础模型可以概率性地权衡它们,而不是应用二进制规则。这个智能合约可能是规范的吗?鉴于现有证据,这个代币可能是合法的吗?传统算法要么有规则,要么没有;智能体可以对置信度进行推理。
  • 解释错误并适应。 当发生意外情况(如交易回滚、输出不匹配预期、模拟与执行之间的状态变化)时,智能体可以推理出错原因并决定如何应对。相比之下,传统算法只是执行 catch 块,它是在路由异常而非解释异常。

这些能力目前虽已实现但尚不完善。基础模型会产生幻觉、误解并犯下自信的错误。在对抗性且涉及资金的环境中,“尝试与未预见的系统交互”可能意味着损失资金。我们的论点不是智能体今天就能可靠地执行这些功能,而是它们能以传统系统无法做到的方式进行尝试,并且随着时间的推移,基础设施可以使这些尝试更安全、更可靠。

智能体系统的核心在于:在开放且动态解释的动作空间中运行,而非在封闭且预集成的空间中运行。

核心摩擦点

从结构上看,紧张局势并非源于区块链共识的缺陷,而是源于围绕它演变的更广泛的交互堆栈。

区块链保证确定性的状态转换和最终性,但并不试图在协议层编码经济解释或意图验证。这些责任历来被外包给前端、钱包、索引器和其他链下协调层,且通常有人类参与其中。

智能体系统压缩或消除了这种分工。它们必须以程序化方式重建具有经济意义的状态,评估目标是否得到推进,并在简单的交易包含之外验证结果。这些负担在区块链上变得尤为沉重,因为智能体在开放、对抗且快速变化的环境中运行。

1. 发现摩擦(Discovery Friction)

发现摩擦的产生是因为 DeFi 动作空间在开放环境中扩张,而相关性和合法性是由人类通过社交、市场和工具层过滤的。

从链上的角度来看,每个部署的合约都具有同等的决策地位。一个合法的协议、一个恶意分叉、一个测试部署和一个被遗弃的项目,在链上都表现为可调用的字节码。区块链并不编码哪些合约重要,或者哪些是安全的。

从链上角度看,每个部署的合约都是同等可发现的。合法协议、恶意分叉、测试部署和废弃项目都只是可调用的字节码。

因此,智能体必须构建自己的发现机制:扫描部署事件、识别接口模式、跟踪工厂合约并监控流动性形成,以确定哪些合约应进入其决策宇宙。

策略范围发现与开放式发现的区别

摩擦出现在两个更高层面:确定发现的合约是否合法(规范性问题),以及确定它是否与开放式目标(而非预定义的策略类型)相关。运行“分配给最佳风险调整机会”指令的智能体不能仅依赖策略衍生过滤器,它必须针对目标本身评估新遇到的机会,这需要解析陌生接口并推断经济功能。

2. 控制平面摩擦(Control Plane Friction)

身份和合法性通常在协议之外通过策展、治理、文档和操作员判断来解决。在目前的流程中,人类将 Web 的信任层作为非形式化验证器(如通过 DeFiLlama 或官方社交账号找到合约地址)。

Mechanical Turk 1789年的国际象棋机械玩家“土耳其机器人”看似自主,实则依赖隐藏的人类操作员。

智能体默认不会通过社交语境解释品牌或“官方性”。虽然可以给智能体提供策展后的输入,但将这些信号转化为持久的机器可用信任假设,需要明确的注册表、策略或验证逻辑。

规范合约识别并非协议原语

链上通常没有“这是应用 X 的官方合约”的原语。智能体试图与 Aave v3 交互时,必须确定哪些地址是规范的,以及这些地址是不可变的、代理可升级的,还是处于待定治理变更中。

在缺乏规范注册表的情况下,“官方性”变成了一个推断问题。这意味着智能体不能将合约地址视为静态配置,而必须在运行时重新推断规范性,或承担与弃用、受损或伪造部署交互的风险。

代币真实性与元数据问题

代币元数据(名称、符号、精度)并非权威,只是代码返回的字节。例如,以太坊上有近 200 个代币的名称为“Wrapped Ether”,符号为“WETH”,精度为 18。

以太坊上有近 200 个代币名为“Wrapped Ether”,符号为“WETH”。如果不查看 CoinGecko 或 Etherscan,你能分辨哪个是规范的 WETH 吗?

对于智能体来说,链不检查唯一性,也不关心注册表。虽然存在链上启发式方法(如检查流动性深度),但没有一个能提供确定性证明。

3. 数据摩擦(Data Friction)

区块链通常不在协议层暴露标准化的经济对象,而是暴露存储插槽、事件日志和函数输出。诸如市场、头寸或健康因子之类的抽象概念并非协议原语,而是由链下层重建的。

这种问题在不同协议类别中会复合。金库的份额价格、借贷市场的抵押因子、DEX 池的流动性深度和质押合约的奖励率,都是具有经济意义的原语,但都没有通过标准化接口暴露。

案例研究:借贷市场的检索碎片化

在 Aave v3 上,检索储备资产状态通常涉及:

  1. 通过 getAllReservesTokens 枚举储备资产。
  2. 为每个资产调用 getReserveData 获取包含流动性总量、利率指数等的结构体。

相比之下,在 Compound v3 (Comet) 中,每个部署代表一个单一市场,没有统一的储备结构体。市场快照必须通过多个函数调用(基础利用率、总量、利率、抵押资产配置、全局配置参数)构建。

从智能体的角度看,两者都是借贷市场;但从集成角度看,它们是结构完全不同的检索系统。

碎片化引入的延迟与一致性风险

由于经济状态不是作为单个原子对象暴露的,智能体必须进行多次 RPC 调用。每次额外的调用都会增加延迟和块不一致的风险。在波动环境中,当计算出供应利率时,利用率可能已经改变。

数据流匹配问题

区块链上的经济状态访问本质上是拉取式(pull-based)的。外部系统向节点查询所需状态,而不是接收持续的、结构化的更新。

智能体系统可能会从推送式(push-based)架构中受益:智能体不是轮询数百个合约的状态变化,而是接收直接推送到其操作上下文中的结构化、预计算的状态更新。

4. 执行摩擦(Execution Friction)

执行摩擦的产生是因为目前的交互层将意图翻译、交易审查和结果验证打包进了围绕前端和钱包构建的工作流中。

智能体移除人类后,必须用机器原生等效功能取代三个关键的人类功能:

  1. 意图编译: 将“将稳定币移至最佳收益处”编译为具体的行动计划(协议、市场、路由、顺序)。
  2. 策略执行: 智能体需要显式的策略约束作为机器可检查的规则(如滑点容忍度、杠杆限制、白名单合约)。
  3. 结果验证: 交易包含并不代表任务完成。智能体必须以程序化方式评估后置条件(如验证余额增加是否符合预期)。

多步工作流与失败模式

DeFi 执行通常是多步的(授权 → 交换 → 存款 → 借入 → 质押)。人类可以忍受部分完成并手动调整,但智能体需要确定性的编排。如果任何步骤失败,智能体必须决定是重试、重新路由、撤销还是暂停。

这创造了新的失败模式:

  • 决策与包含之间的状态漂移: 利率或流动性在模拟与执行之间发生变化。
  • 非原子执行与部分成交: 某些动作可能跨多个交易执行。
  • 授权与批准风险: 智能体必须将授权范围(金额、支出者、时长)作为安全策略的一部分进行推理。

结论

区块链并非为原生提供自主智能体所需的语义和协调层而设计。它们的设计初衷是在对抗性环境中保证确定性执行和状态转换共识。

智能体系统的出现瓦解了这种架构。它们移除了人类解释者、批准者和验证者,并要求这些功能变得机器原生。这种转变暴露了四个维度的结构性摩擦:发现、信任解析、数据检索和执行编排。

缩小这些差距可能需要在堆栈的多个层面建立新的基础设施:

  • 将跨协议的经济状态规范化为机器可读模式的中间件。
  • 暴露语义原语(如头寸、健康因子)而非原始存储的索引服务。
  • 提供规范合约映射和代币真实性的注册表。
  • 编码策略约束、处理多步工作流并以程序化方式验证目标完成情况的执行框架。

核心挑战不在于让智能体签署交易,而在于为它们提供可靠的方法,来执行目前在原始区块链状态与行动之间由软件和人类判断共同处理的语义、信任和策略功能。

  • 原文链接: galaxy.com/insights/rese...
  • 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
点赞 0
收藏 0
分享
本文参与登链社区写作激励计划 ,好文好收益,欢迎正在阅读的你也加入。

0 条评论

请先 登录 后评论
Galaxy
Galaxy
Official Galaxy X account. Global leader in digital assets and data center infrastructure.