本文探讨了AI代理对支付系统的需求,详细介绍了x402协议作为一种基于HTTP 402和稳定币的机器原生支付轨道。文章分析了x402的工作原理、优势、当前采用情况及其挑战。

1849 年,数万名男子前往加利福尼亚淘金。有些人成为富翁。大多数人一贫如洗。但最大的成功属于那些制造镐和铲子的商人:这些基础工具只要地下有黄金,就始终重要。今天的淘金热是人工智能。支付正成为 AI Agent工作流中一个基础部分,而不可避免地,促成这些支付的通道成为了今天的镐和铲子。本文深入探讨了 x402 协议;一种特定的新兴开放式Agent原生支付通道,包括它是什么、如何工作、目前的采用情况,以及当机器转移资金时 x402 面临的开放问题。
历史由巨大的变革定义。突如其来、深刻的转变改变了生命本身的基础。我们今天居住的物理地理是在大约 1.75 亿年前,当地球的构造板块移动和分裂时形成的。构造板块至今仍在移动,尽管速度慢得多,但现代世界最大的巨大变革是通过人类创新实现的。
基础性发明,无论是苏美尔轮子、古腾堡印刷机还是蒸汽机,都产生了一个类似的强化飞轮:人类制造机器,这些机器产生经济盈余,从而有更多的资金用于制造更多的机器(而且是更好的机器),这进一步复合式增长产出。随着技术的改进,实验成本下降,而迭代速度增加。我们已经看到这种动态在过去几十年中,特别是随着计算机及其围绕它们构建的应用程序和服务,加速发展。

今天,这种变革性动态正通过软件,特别是人工智能实现。
AI 已经存在很长时间了。关于神经网络的第一篇论文早在 1943 年就已发表。80 年代的专家系统和 90 年代的统计机器学习悄然将 AI 嵌入到生产工作流中,从信用评分到广告投放。
垃圾邮件过滤器、推荐引擎和欺诈检测自 2000 年代初以来一直在机器学习模型上运行。改变的是界面。生成式人工智能允许人类通过自由形式的自然语言与这些系统交互,这种可访问性的转变将 AI 带入了主流消费市场。
OpenAI 推出了 ChatGPT,提供了一种简单直观的方式与其底层 GPT 模型进行交互,该模型在 5 天内达到了 100 万用户,2 个月内达到了 1 亿用户,是历史上消费者互联网采用速度最快的。此后不久,竞争性生成式人工智能应用程序(例如 Gemini、Claude、Grok)开始推出,随之而来的竞争促使主要人工智能实验室迅速改进模型并推出新的产品功能。从消极的一面来看,随着企业高管继续迭代裁员并增加对 AI 的投资,对工作岗位流失的担忧日益加剧(尽管值得注意的是,今天超过一半的美国工人从事的是 1940 年不存在的工作)。
没有人能确定 AI 最终将如何重塑社会。但截至 2025 年末,全球约六分之一的人使用过生成式人工智能,这项技术在三年前几乎不存在。尽管仍处于早期,但一场巨大的变革正在进行中。

但是,仅仅通过与 AI 对话能做的事情是有限的。读取权限,例如让 LLM 查找信息、总结大量文本、编写代码、分析数据,显然很有用,但也仅限于此。但如果将其与写入权限结合,换句话说,让 AI 实际在外部环境中执行操作,则解锁了完全不同的能力集合。
2025 年,OpenAI 推出了 Operator 和 Codex,Anthropic 发布了 Claude Code,Perplexity 推出了 Comet,Google 将 Gemini 驱动的Agent嵌入到 Workspace 应用程序中,微软将 Copilot 更深入地推向 Office 和 Windows。Perplexity、Cursor、Sierra 和 Cognition 各自获得了数亿美元的新资金,并创下了收入新高。很明显,Agent将定义人类与 AI 交互的下一个篇章。
然而,一个被忽视的现实是,自主Agent多年来一直在推动在线经济活动。数字广告市场是一个庞大的Agent经济,运行在几乎所有由广告支持的网页(包括今天大多数大型消费者网站和平台)之下。

每当有人加载一个网站时,空白的广告位就会被放入一个小型拍卖中出售,代表广告商(可以是任何在线销售商品的商家)的Agent会确定该广告位的价值并提交竞价。出价最高者获胜,获胜的广告在几百毫秒内被渲染到广告位中。当网站加载时,广告已经显示出来。为了了解这种规模,请考虑程序化数字广告支出每年达数千亿美元,这占据了今天展示广告预算的 90% 以上。
爬虫是另一个例子。这些自主Agent漫游网络,跟踪 URL,获取网页,并将这些内容输入到大规模索引和训练管道中。同样,数据抓取器从网页中提取原始数据,并广泛应用于今天的各个领域。从消极的一面来看,“恶意机器人”(旨在利用在线业务逻辑的程序)在 2025 年占据了多达 37% 的互联网流量。总的来说,超过一半的网络流量已经由自主软件Agent运行。
然而,显然很少有人知道这些Agent,更少有人实际使用它们。尽管这些Agent在其特定功能(例如,竞价广告位)方面可能很有用,但它们的效用受到其专门构建性质的限制。一个爬虫爬取,一个数据抓取器抓取,一个竞价者竞价,仅此而已。
当这些不同的功能堆叠到一个单一程序中,从一个单一界面控制时,应用程序的性质就完全改变了。这就是大多数人今天所知道的通用人工智能Agent的作用所在。它们最根本的变化是能够在单个界面内执行许多不同的任务,并跨多个应用程序和环境操作。这些Agent旨在加速人类的产出和生产力:它们以更快的速度完成更多的事情,随着它们的采用增长,它们产生了越来越大的网络流量份额。
那么,Agent到底是什么?简单来说,它是一个面向目标的软件程序,接收一个目标,识别实现该目标所需的步骤,并利用其可用的工具在特定环境中采取行动以实现该目标。
用户输入一个提示,然后将其传递给Agent的运行时环境。从那里,Agent向其模型提供一个提示,该模型做出决策并作为操作的大脑。Agent使用其可能访问的任何可用工具(即网络浏览器、API、数据库、日历等)来执行这些任务,然后执行一个吸收其行动信息、推理信息并使用这些信息来确定其下一个行动或决策的循环,直到达到定义的停止点(例如,用户提示中指定的目标)。

Gartner 预测到 2026 年底,大约 40% 的企业应用程序将嵌入特定任务的 AI Agent。McKinsey 估计到 2030 年,AI Agent将占据全球消费者商务 3-5 万亿美元的份额。高盛预计,到 2030 年,即使 AI Agent扩展了整体软件市场,它们也可能侵蚀 SaaS 有意义的潜在市场(TAM),成为知识工作的主要界面。

当然,这些是预测而非事实,而一些关于Agent即时影响的预测已被证明过于宏大。尽管如此,我们很难(也很天真)忽视这里所下赌注的规模:如果 AI Agent能够获得其预测增长的一小部分,它们就会开始成为消费者。而消费者首先需要一种方式来支付他们希望购买的商品和服务。
于是,金钱的作用就出现了。金钱是一种协调工具:一种共享的交换媒介和记账单位,使人类能够与陌生人协调并高效地结算交易。它使人类社会能够大规模合作;将个人努力复合式增长,成为一个更宏大生产性整体的一部分。
随着 AI Agent承担越来越多的经济责任,它们也需要访问这个共享的协调层。但Agent是结构上不同的消费者,具有不同的行为模式和优化标准。它们不像人类那样面临认知或计算限制。它们的目的就是将人类产出成倍增加:在更短的时间内完成更多的工作,尽管通常在此过程中会更频繁、更细粒度地消耗资源。Agent也不会受到广告对人类消费者施加的情感诉求的影响。它们在设计上就是经济理性行为者。
在此背景下,金钱扮演着一个熟悉但功能上扩展的角色。作为交换媒介,它最大限度地减少了交易摩擦,实现了Agent之间的无缝价值转移。作为记账单位,它提供了Agent进行精确成本效益分析所需的标准化衡量标准,评估任务的计算成本是否值得其预期回报。作为价值储存,它允许Agent保留购买力,并跨时间和任务高效分配资本。
然而,要利用这些功能,我们必须区分资产本身和转移资产的基础设施。金钱是一种协调工具,但支付是其作用机制。剥离其核心,支付是结算债务的一种方式:核对账本以证明价值实际已易手的过程。对于Agent来说,这是合同的功能执行。它是将决策转化为实现结果的步骤,解锁了对资源的访问。没有这种结算能力,Agent实际上就陷入了只读状态。Agent需要一种指定方式来支付在线商品和服务。
显而易见的是,这已经成为可能。AI Agent已经可以访问每年有数万亿美元在线流动的现有基础设施。这些系统围绕我们称之为结账专用流程而构建。一个(人类)用户确认其购买意图,为该交易创建支付Token,然后商家通过其各自的 PSP 基础设施处理支付。
以 OpenAI 和 Stripe 的Agent商务协议 (ACP) 为例。ACP 是一个开源 API 规范,它通过标准化商家如何展示其商品目录、Agent如何表示报价和购物车,以及在用户确认意图后支付详情如何委托回商家的 PSP,从而使 AI Agent能够代表用户完成购买。今天 ACP 最清晰的实现是 ChatGPT 中的即时结账,由 Stripe 的共享支付基础设施提供支持。通过直观的自然语言提示,用户可以在熟悉的 ChatGPT 界面中处理购物需求(例如,购买跑鞋、订外卖、预订)。在后端,ChatGPT 将一个范围受限的支付Token传递给商家的 PSP,商家收取费用。

除了 ACP,随着Agent商务堆栈开始形成,Agent支付正在增长。Claude Code 和 Codex 使用用户账户上的预付余额运行工作流。OpenClaw 更进一步,允许向Agent发行具有支出限额的虚拟卡。Google 的 UCP 和 AP2 使用与用户信用卡和电子邮件地址关联的支付Token。
这个系统有效。它不会立即促使重新发明。对于人机代理结账流程,这个模型完全按照设计执行。
然而,这里真正重要的是,这并非Agent支付的最终形式。当应用于大规模持续Agent工作流时,这个模型会变得紧张。
这个新兴的生态系统已被描述为一个“虚拟Agent经济”:一组关联的数字市场,其中 AI Agent相互交易,独立于人类劳动产生经济价值。关键在于,在这样的经济中,Agent以超出人类直接监督的规模和速度进行交易和协调。而这正是当今商务堆栈中开始出现关键经济和技术限制的地方。
像 ACP 这样的协议使用传统支付机制:信用卡、数字钱包、先买后付服务。使用这些协议的消费者和商家仍然承担其经济成本:每笔交易 2.9% + 0.30 美元,多日结算,120 天退款窗口期。对人类来说令人烦恼但可管理。
然而,Agent以更大规模进行交易。Agent系统通常将复杂问题分解为价值仅为几美分的一小部分的细粒度分布式任务。应用于数千个步骤,成本结构崩溃;考虑到在价值例如 0.02 美元的小任务上收取 0.30 美元的固定费用,这已经是 1,500% 的加价。
归根结底,这源于一个更深层次的架构问题。正如 Felipe Montealegre 在《互联网金融》中阐述的那样,现代金融系统只是一系列私有服务器的集合。转移价值需要获得许可的管理员在这些服务器之间核对条目,这一过程反映在结算延迟和分层费用中。当 AI Agent通过 ACP 这样的协议发起购买时,会发生同步链式反应:请求路由到 Stripe,Stripe 路由到发卡银行。Stripe 有其费用层,Visa 和 Mastercard 有其费用层,银行也有其费用层。每个都独立运行。
这种核对机制的效率设定了整个经济的速度限制。一份 2024 年 BIS 报告发现,数字支付普及率每增加一个百分点,两年内人均 GDP 增长就会增加 0.10 个百分点。如果为人类消除摩擦能产生这样的效果,那么对于以快几个数量级运行的Agent来说,其影响会更大。
还有一个不那么明显的成本:许可本身。传统通道是围绕着离散的人对人购买(交易规模有意义,例如至少几美元)而设计的。在其上构建的合规架构——KYC、AML 检查、退款系统、代理银行——反映了在该规模下对法律责任的理性回应。一个 0.004 美元的 API 调用与 50,000 美元的电汇面临的风险不同,但今天的通道以类似的开销对待它们。
Nick Szabo 在 1999 年识别出一个相关问题:心理交易成本,即决定一笔小额购买是否值得进行的认知负担。早期的小额支付业务失败并非因为技术无法处理小额支付,而是因为人类必须有意识地批准每一笔。大规模的注意力成本高于金钱。
Agent系统似乎解决了这个问题。Claude Code 从预先注资的账户中提取资金,无需打断用户即可继续。但这只是一个有预算的代理,而不是一个自主经济行为者。Agent的经济范围在设置时由其人类操作员固定。它不能协商访问新资源,不能获取预先配置之外的能力,也不能在会话之外拥有任何经济身份。Szabo 的问题再次成为Agent能做的事情的瓶颈。
Agent在使用传统支付通道时遇到的另一个关键限制是身份。在现有的人机代理结账流程中,Agent本质上是借用其用户的身份进行交易。整个堆栈假设支付方是一个具有合法身份、银行关系和个人责任的人,而Agent都没有这些(至少目前还没有)。当 Claude Code 进行支付时,它是通过其用户的 Stripe 凭证、商家的欺诈模型、卡网络的退款规则和银行的结算框架进行的。如果每个交易都围绕着合法人类身份进行,那么这样的Agent经济就不是真正的Agent经济了。
这也带来了悬而未决的法律问题。Agent如何进行 AML 检查?提交可疑活动报告?筛选制裁违规行为?这些问题可能很快就会有答案,因为这个问题现在正在联邦层面获得认可。NIST 的国家网络安全卓越中心刚刚发布了一份概念文件,内容涉及 AI Agent身份和授权,将其识别为需要新开源未来标准的未解决基础设施问题。
人机代理结账流程确实很有用。但其下一个演进——一个 AI Agent经济——中,成本、自主性和身份是现有系统无法调和的三个限制。多日结算和缺乏 24/7 全球通道进一步增加了摩擦,尽管这些次于上述结构性问题。解决这些限制首先要了解 AI Agent实际如何工作。Agent是软件,它们在网络上运行,因此,寻找支付层的最自然的地方可能就在网络本身。
POST /merchant/transfers/payment HTTP/1.1
Host: payments.example.com
Content-Type: application/json
Content-Length: 402
{
"payment_transfer": {
"reference": "PAYMENT123456",
"amount": "1337",
"currency": "EUR",
"sender_account_uri": "pan:5299920000000149;exp=2020-08;cvc=123",
"sender": {
"first_name": "Amelia",
"middle_name": "Rosenburg",
"email": "test123@sender.example.com"
},
"recipient": {
"first_name": "Tyrone",
"middle_name": "Johnston",
"email": "test123@example.com",
"merchant_id": "123"
},
"authentication_value": "ucaf:jJJLtQa+Iws8AREAEbjsA1MAAAA",
}
}
一个例子,展示了如何使用 POST 请求通过 HTTP-402 启动交易,调用支付 API。
HTTP 402 几十年前就被预留,但从未实现。它预见了一个支付可以在协议层面处理的世界,就像今天处理认证的方式一样。它只是缺少使其成为现实所需的两样东西:一个明确的标准,以及一种能以网络速度流通的资金形式。
正如 HTTP 在互联网上自由且无需许可地传输信息一样,公共区块链通道上的全球价值转移已经以有意义的规模发生。数万亿美元的稳定币已经转移。目前流通中的稳定币供应量超过 3080 亿美元。

McKinsey 和 Artemis Analytics 追踪到 2025 年稳定币支付量为 3900 亿美元,比上一年翻了一番多,交易量集中在 B2B 和 P2P 支付、与银行卡Hook的支出以及 B2C 支付。尽管链上稳定币活动历史上主要是交易驱动的,但特定链数据表明支付需求正在出现,并且份额不断增长。
稳定币最简单的说法是,它是一种编程以维持稳定交换单位价值的软件,最常见的是美元。一个被称为智能合约的软件被调用,然后稳定币被铸造或赎回。这些软件在几个关键特性上特别适合网络原生支付,尤其是在Agent商务中。
经济优势是最明显的。稳定币交易的成本比传统支付通道便宜几个数量级,因为没有中间商抽取佣金。稳定币交易是共享数字账本上余额的重新分配。消耗的主要资源是更新该余额所需的计算能力,作为 gas 费用支付。大多数主要链上的 gas 费用现在都低于一美分。与信用卡相关的交易费用相比,成本差异显著。
一个更独特的优势是可编程性。正如 Hadfield 和 Koh 指出的,Agent需要“可编程货币”才能实现大规模复杂经济活动所需的自主协作。稳定币通过智能合约发行和赎回,其中支付条件可以直接编码:有条件释放、支付限额、定期转账等。Agent可以通过加密密钥控制钱包并直接签署交易,这消除了支付层面对人类凭证的需求。
Haseeb Qureshi 提出了更尖锐的观点:加密货币比人类更适合Agent。Agent可以在几秒钟内验证交易详情、审计智能合约代码并确认结算。它不需要信任交易对手的法律代表或司法管辖区的执行机制。另一方面,代码是确定性的:给定相同的输入,它总是产生相同的输出。一个规定“当条件 X 满足时释放支付”的智能合约,每次条件 X 满足时都会释放支付,执行中内置了强制执行。
Agent通过智能合约签订经济协议,在签署前确切知道在所有可能条件下会发生什么。它可以在几毫秒内阅读代码、验证逻辑并确认结果。稳定币只是代码。钱包只是代码。Agent可以持有资金、交易并签订经济协议,就像发送 HTTP 请求一样自然。
HTTP 402 定义了服务器如何发出资源需要支付的信号。稳定币提供了能以网络速度流通的资金。两者结合起来,不再像一个结账流程,而更像一个 HTTP 握手。
考虑一台自动售货机。它提供一种特定商品,汽水或糖果棒,但前提是支付确切的金额。运营商不需要生产它销售的任何东西。它只是提供中立基础设施,让愿意的买家访问资源。
这是网络原生Agent支付的模型。Agent发出请求,服务器回应支付要求,Agent提供支付,然后资源被解锁。HTTP 402 提供状态码。稳定币提供结算层。缺失的部分是将它们联系在一起的:一个网络原生自动售货机。
2025 年 5 月,Coinbase 开发者平台工程主管 Erik Reppel 与同事 Kevin Leffew、Dan Kim 和 Nemil Dalal 共同发表了一篇白皮书,为 HTTP 402 提供了 29 年来的首次真正实现:x402 协议。
这个想法,也是本文的中心前提,很简单:互联网一直需要一种原生的方式来发送和接收支付,而稳定币现在使这成为可能。Coinbase 自 2015 年以来一直在探索互联网支付标准,但即使那时,这个想法也超前于时代。到 2025 年 5 月,条件终于成熟。Base 和 Solana 等链上的链上费用仅为几美分的一小部分。稳定币供应量迅速增长,接近 3000 亿美元。Agent商务已经具体化,足以进行构建。
x402 是一个开源支付协议,它标准化了网络客户端和服务器如何使用 HTTP 402 和稳定币交换价值。从最字面意义上说,它就是那个缺失的网络原生自动售货机:买家发出请求,卖家报价,支付直接通过 HTTP 结算,而无需双方事先建立关系。
其核心在于,x402 分离了三件事:传输(数据如何在各方之间移动)、支付逻辑(价值移动的方案)和结算网络(该价值在链上落地的位置)。这种分离使得 x402 具有可扩展性。HTTP 是主要传输方式,402 状态码是原生信号,但相同的支付逻辑可以在 MCP 或 A2A 上运行,而无需触及底层标准。在实践中,x402 作为轻量级中间件插入现有网络基础设施。服务器端实现只需单次函数调用。客户端可以支付任何受支持的端点,而无需与资源提供商事先建立关系。
简而言之,x402 支付流程的工作原理如下:
HTTP-402 以及机器可读的支付指令。200 OK 响应以及请求的资源和交易证明给客户端。在某些步骤中,细节因具体的链架构而异,我们将在下面详细阐述。但重要的是,每个步骤都映射到一个特定的组件,分为两层:通信发生的链下层,以及支付结算的链上层。

x402 在设计上是传输原生的。虽然 HTTP 是主要实现方式,但该协议补充了现有数据传输,而无需强制要求在典型的客户端-服务器流程之外进行额外的请求。任何基于请求-响应的系统都可以实现 x402 支付流程,这意味着 x402 可以在 HTTP 上运行,用于 Web API 和 REST 服务;在 MCP 上运行,用于 AI Agent工具和资源;在 A2A 上运行,用于直接Agent对Agent支付。
主要的链下组件是客户端和服务器,它们适用于所有受支持的传输层。
客户端代表买家:请求访问付费网络资源的实体。这可以是通过 HTTP 客户端库进行调用的人类开发者,也可以是作为网络客户端运行的 AI Agent。客户端发送初始请求,构建有效的支付负载,并使用包含签名负载的 Payment-Signature 头部重新提交请求。
服务器代表卖家或资源提供商。通常是 API 或内容端点,但最终是通过受支持网络可访问的任何数字资源。服务器响应客户端请求并附带支付要求,验证传入的支付负载,并在交易确认后返回资源。
对于Agent来说,不需要单独的集成,支付在 HTTP API、MCP 工具和 A2A 交互中自动处理。
x402 协议的链上层是发生支付的地方。这包括一个用于持有资金和授权支付的钱包,一个协调器服务用于验证负载并在链上提交支付,以及实际在各方之间移动的稳定币或代币合约。
为了使用 x402 执行支付,客户端需要一个有资金的加密钱包。钱包是一个公私钥对。公钥是一个假名标识符,作为客户端的链上地址,类似于路由号码。私钥授权客户端签署和执行交易,类似于密码。当Agent需要访问付费资源时,它通过签署交易授权来构建支付负载。签名的负载包含公钥,以便服务器可以验证发送方并独立地在链上确认交易。
为了在链上结算支付,服务器使用一个协调器。协调器是一个交易中继和 gas 抽象服务:它接收签名的支付负载,根据代币合约的授权参数验证它,并代表服务器在链上广播转账,在此过程中支付 gas 费用。当服务器接收到签名的支付负载时,它可以直接处理链上结算,或者将负载 POST 到协调器的 /settle 端点。协调器验证加密签名,调用代币合约的 transferWithAuthorization,从其自身余额中支付 gas 费用,并将交易广播到网络。
关键的是,协调器不是托管人。它执行的是已经通过客户端签名加密授权的转账。它不能重定向资金或修改支付条款;它只能执行或拒绝客户端已经签署的内容。Coinbase 在 Base 和 Solana 上运行一个用于 USDC 支付的协调器,但这个角色是开放的。任何服务器都可以在本地运行自己的验证逻辑,如果它不想外包的话。
x402 支付流程中的 HTTP 握手在所有链上相同。不同的是链上结算机制,这是 EVM 兼容链和 Solana 之间架构差异的下游。
在 EVM 兼容链上,x402 使用 EIP-3009 作为其核心代币转账原语。EIP-3009 由 Coinbase 工程师 Peter Jihoon Kim、Kevin Britz 和 David Knott 于 2020 年撰写,默默地促成了每月数百亿美元的 USDC 转账量。
关键机制是授权与执行的分离。EIP-3009 提供一次性加密签名,在链下创建,授权在定义有效期内将特定金额的特定转账发送到特定地址。该签名成为 x402 中的支付负载。
这里涉及两个主要函数:transferWithAuthorization 和 receiveWithAuthorization。客户端签署一个结构化的 EIP-712 消息,包含支付详情和一个随机的 32 字节 nonce。这里使用随机 nonce 允许并行创建多个支付授权,没有排序限制。
当服务器接收 Payment-Signature 头部时,验证是一个确定性清单:验证接收地址匹配,支付金额满足要求,代币合约是可接受的资产,validBefore 时间戳未过期,EIP-712 签名在加密学上是有效的。由于授权与执行分离,服务器在链上提交任何内容之前验证签名的负载。无效签名、金额不匹配或时间戳过期都会以零成本拒绝双方。
如果所有检查都通过,服务器或其协调器调用代币合约上的 transferWithAuthorization。协调器从其自身余额中支付 gas 费用,这就是为什么客户端只需持有支付资产,而不是链的原生 gas 代币。一旦确认,服务器返回请求的资源以及交易哈希和区块号,客户端可以独立验证。

Solana
在 Solana 上,x402 使用不同的结算机制,这反映了交易在该链上的结构方式。客户端不是使用链下 EIP-712 签名授权未来的转账,而是使用 Ed25519 签名构建并部分签署一个完整的 SPL 代币转账交易,然后将其编码为 Payment-Signature 头部中的 base64 负载。交易是部分签名的,因为客户端签署转账指令,同时指定协调器为费用支付方,这个角色需要在交易可以广播之前获得协调器自身的签名。
在构建交易之前,客户端查询协调器的 /supported 端点,以获取其费用支付方地址并确认对所请求网络的支持。协调器然后接收部分签名的交易,验证它,添加自己的签名作为费用支付方,并将其广播到网络。客户端使用 USDC 支付,无需持有 SOL 作为 gas。
EVM 和 Solana 流程都通过各自链的原生原语实现了原子结算。EVM 流程使用链下签名授权未来的转账,由协调器执行;Solana 流程使用部分构建的交易,由协调器完成并广播。
除了机制之外,每个链都具有实际优势。EIP-3009 将 gas 费用从客户端转移到服务器,服务器接受这一点是因为支付金额在结构上超过 gas 费用。对于对同一端点进行重复调用的Agent,服务器可以将多个授权批量处理到一个交易中,将固定的基础 gas 成本分摊到多个支付中。授权与执行的分离还使得在低连接环境中进行支付成为可能:客户端可以在本地构建并签署 EIP-712 消息,无需网络访问,并在连接恢复时传输它。Solana 的架构针对吞吐量进行了优化,使其更适合高频支付模式。
尽管如此,x402 是链无关的。该协议使用 CAIP-2 网络标识符,因此相同的握手处理 Base、Solana、Polygon、Scroll 和 Avalanche 之间的路由。服务器在 402 响应中指定其接受的网络和资产;客户端从其钱包支持的选项中选择。随着协调器生态系统成熟,新链满足 x402 的接受标准,协议在不改变底层标准的情况下扩展。
值得退一步审视 x402 的价值所在。
在线交易的能力正成为 AI Agent的基础要求。作为通过 HTTP 通信并持续消耗网络资源的软件程序,付费是其运作的核心。问题在于,支撑如此基础功能的底层基础设施并非为它们而建。在人机代理结账流程中,Agent通过人类基础设施进行交易,借用人类凭证并依赖为不同类型消费者设计的中间机构。x402 运行在Agent已经操作的相同网络原生通道上。
差异是结构性的。成本是最明显的;x402 目前支持的链(例如 Base, Solana)上稳定币交易的 gas 费用仅为几美分的一小部分,这是传统 x402 支付流程中唯一的交易成本。这匹配了 AI Agent运作的细粒度经济性(例如,按调用、按任务等);如果每笔交易收取 2.9% + 0.30 美元的费用,就会迅速崩溃。
结算问题更深层次。由于支付条件在执行时强制执行,除非满足预定义条款,否则交易无法完成。通道通过代码强制执行此操作,因此Agent不需要了解或信任交易对手。这是事后验证和先发制人执行之间的区别,这使得委托高风险工作流变得安全。操作员一次性定义支出限制:每日上限、每笔交易限额、白名单地址。Agent在其范围内执行,无需每次调用都获得批准。
除了成本和结算,还有身份。Agent进行的每笔交易都由相同的加密钱包地址签署,这是一个一致且可验证的标识符,由其拥有和控制。钱包随Agent一同移动,标准化了它在每次交互中呈现的方式,而不是为每个新服务借用人类的凭证。
细粒度定价结构,例如按文章付费、按视频付费、按流付费,一直是数字内容的直观商业模式。早期的网络就是带着这种愿景构建的,但从未实现,因为交易成本使得小额支付不经济,而批准每笔交易的认知负担令人疲惫。x402 解决了这两个问题;定价可以真正匹配内容的实际消费方式,而不是捆绑到大多数用户只部分使用的订阅中。每笔交易几美分的一小部分,它们是可行的。
对于 AI Agent来说,细粒度是必然,因为它们以离散、可测量的单位(每个提示的推理、每个查询的市场数据、每个作业的计算、每个任务的 API 调用)消耗资源。很难将这些自然地映射到订阅定价上,而订阅定价之所以存在,很大程度上是因为按单位的小额支付不可行。
x402 也重塑了Agent的软件市场。历史上,访问一项功能意味着要么付费订阅,要么自己构建。随着推理成本下降,自行构建变得越来越可行。x402 引入了第三种选择:工作流中的Agent可以立即访问一项功能,只为所使用的付费,而不是启动推理来复制它。这是Agent独特的实时成本决策能力,它意味着一个围绕访问而非所有权构建的软件市场。
最深远的影响是产品结构会发生什么变化。商品和服务之所以捆绑,很大程度上是因为交易成本使得细粒度定价不切实际。一篇新闻文章将采访、照片和上下文打包在一起,因为单独销售每一部分不值得其开销。同时,AI Agent可以追踪用户已经阅读的内容,与内容提供商协调,只呈现新的或相关的内容,并精确地为此付费。同样的逻辑适用于任何具有可分离组件的数字产品。随着小额支付使单个内容片段在经济上可行,Agent对Agent商务可能会催生一个检索生态系统,内容创作者按使用次数获得报酬,而用户获得更接近个性化的产品,而不是标准化产品。
这扩展到 AI Agent实际如何通过工作流移动。当Agent在任务中遇到付费墙时,服务器返回带有机器可读支付指令的 402。Agent构建签名的支付负载,在链上结算,然后继续。工作流从不因手动授权而停止。唯一先决条件是已注资的钱包,操作员一次性预先配置。
这在多Agent系统或群体中特别相关。现代Agent工作负载日益分解,由通过移交协调的专业Agent组成:一个Agent调用另一个Agent,后者调用一个服务,该服务再调用另一个Agent。当支付需要流经同一个图谱时,中央计费关系可能成为操作瓶颈。x402 的无状态设计意味着每个跳步独立结算,从而使支付层随工作流扩展,而不是凌驾于其上。
所有这些都易于集成。x402 附带完整的参考实现:核心协议库、用于 Express.js 和 Next.js 的服务器端中间件,以及用于浏览器和 Node.js 环境的客户端库。服务器端集成是一个单函数调用。Agent可以访问付费端点,接收 402,构建签名的负载,并在链上结算,无需在上面编写任何自定义支付逻辑。
考虑到这一点,让我们来看看 x402 目前的采用现状。
x402 于 2025 年 5 月 6 日推出,最初支持 Base 上的 USDC。自那以来的九个月里,该协议总共处理了 1.64 亿笔交易,交易额达 4640 万美元,共有 44.7 万独立买家和 8.9 万卖家。
这种增长并非线性;在 11 月 17 日达到峰值时,x402 推动了 Base 每日 1700 万笔交易的 19%,这惊人地证明了该协议能如此迅速地饱和单条链的活动。此后,尽管链上和加密市场活动普遍回落,交易量显著下降,但 3 月份交易量和交易笔数再次显著回升。
数据告诉我们的,以及没有告诉我们的,值得更仔细地审视。

x402 是一个链无关框架,目前在少数但数量不断增长的链上运行。Base 占据了迄今为止 x402 活动的大部分——1.25 亿笔交易和 3900 万美元交易额——这一成就很大程度上得益于其先发优势,以及作为 Coinbase 原生协调器基础设施所在地,以及协议上最深的协调器生态系统,拥有 27 个活跃协调器。Solana 于 2025 年 7 月上线,迄今已处理 3800 万笔交易,交易额略低于 700 万美元。到 2026 年 2 月初,Solana 正在快速获得交易笔数(和交易额?)的份额,在 2 月 2 日占据了高达 97% 的每日交易份额。尽管如此,Base 仍拥有更大比例的买家(42.3 万买家 vs Solana 的 2.3 万)和卖家(6.8 万 vs Solana 的 2.0 万),表明 Base 在需求侧仍然占据主导地位,即使 Solana 正在获得越来越多的交易笔数份额。
除了 Base 和 Solana,x402 正在积极扩展对新链的支持,目前已在 Polygon、Avalanche、Sei、Optimism 和 Arbitrum 上运行。这些链已上线,但总计仍只占活动的一小部分,相对于 Base 和 Solana。现在判断 x402 的大部分活动将在哪里稳定下来还为时过早,但答案更有可能取决于特定链上的特定应用,而不是链本身的基础设施。
与此同时,协调器生态系统也随协议一同发展。Coinbase 在交易笔数(7800 万)和交易额(2730 万美元)方面仍占主导地位,值得注意的是,他们的协调器提供零费用结构并拥有先发优势。但生态系统已开始多样化;PayAI、Dexter、Daydreams 和 Virtuals Protocol 是更活跃的第三方协调器之一,它们总计占据了最近几个月协调器交易和交易额的大部分。

但并非所有Agent活动都如其所示。例如,尽管最近 Moltbook(一个专为 AI Agent设计的病毒式社交网络)风靡一时,并引起了大量关于数百万Agent发布和协调自己生活的报道,但许多早期活动被揭示为Agent通过训练过的社交媒体行为进行模式匹配,在许多情况下有人类参与。
同样的审查也适用于 x402。Artemis Analytics 在其 x402 控制面板中区分了真实交易和被操纵交易,被操纵交易表明是刷量交易。用 x402 操纵交易的动机之一是为了推出一个 memecoin,推动交易量攀升 x402scan 排行榜,并将这种可见性转化为代币买家。
尽管 x402 于 2025 年 5 月上线,但第一次主要的活动激增仅在几个月后的 25 年第四季度早期发生。其中大部分活动与 memecoin 相关;在 11 月和 12 月初的大部分时间里,被操纵的交易在总交易中占比较大,高于真实交易。

然而,随着过去几个月 x402 总交易量有所下降,真实交易开始占据总交易数更大份额。2 月份连续五天真实交易占总交易数的 100%。

被操纵的交易确实有助于压力测试基础设施、验证结算机制并证明大规模吞吐量。但金融激励及其下游活动稀释了对 x402 采用质量的评估。无论是与 memecoin 相关、与空投刷量相关,还是其他,底线是,被操纵的交易代表的是以金融激励而非 x402 有机效用为优化的行为。
但数字,尽管有用,但只能说明这么多。为了更全面地概述 x402 的采用现状,值得关注 x402 生态系统。
x402 生态系统由 x402 支付流程中的各种参与者组成。客户端代表发出请求以访问付费端点(例如 AI Agent)的买家;服务器是服务和付费端点(API、数据提供商、内容平台以及任何通过 x402 暴露付费路由的数字资源);协调器是处理服务器支付验证和链上结算的各种第三方服务;支持基础设施和工具涵盖了任何 SDK、分析、钱包和开发者工具,使在 x402 上构建变得实用。

x402 生态系统仍处于早期阶段,但一系列服务合作伙伴集成和实验正在该协议之上构建,这展现了其在不同行业和领域所受到的关注和兴趣。
退一步认识到Agent商务是一个范围广泛的多层堆栈,它跨越多个行业,这一点很重要。发现、同意、结账和Agent协调都由不同的协议处理,涉及科技和金融领域的一些最大参与者。
在商务方面:我们之前提到了 ACP,它定义了 AI Agent如何代表人类用户处理从产品发现到结账的购物流程。关键的是,ACP 被设计为与处理器无关,这意味着商家可以插入他们已使用的任何支付提供商。Google 的 UCP(Universal Commerce Protocol)服务于类似目的:它标准化了在 Google 搜索和 Gemini 内部运行的Agent如何代表用户发现产品、协商报价并完成购买。ACP 针对对话式界面(如 ChatGPT)进行了优化,而 UCP 旨在适用于 Google 更广泛的产品范围。同样来自 Google 的Agent支付协议(AP2),比这两者低一层,专门处理授权。在Agent可以花钱之前,AP2 生成一个加密签名的授权,确认真实用户授权此Agent为目的 Y 花费最多 X。每笔交易都获得防篡改记录,与该授权绑定,为商家和金融机构提供可审计的跟踪记录,以验证交易的合法性。Google 的 A2A,现在由 Linux 基金会维护,有超过 100 个支持组织,完全处理不同的问题:来自不同公司和平台的Agent如何相互通信。当一个供应商构建的Agent需要将任务移交给另一个供应商构建的Agent时,A2A 为该协调提供了通用语言。
X402 在几个方面补充了这一堆栈。Google 和 Coinbase 构建了 A2A x402 扩展作为 AP2 内生产就绪模块,专门用于基于Agent的稳定币支付。划分清晰:AP2 提供授权指令,确认Agent有权消费;x402 在该指令到位后执行实际的按调用转账,在链上以 USDC 结算。Cloudflare 将 x402 集成到其Agent SDK 和 MCP 服务器工具中,因此通过 MCP 暴露的任何工具或 API 都可以在授予访问权限之前要求 402 支付。在实践中,一个由 ACP 驱动的助手可能会通过 MCP 发现一项服务,看到该端点返回 402,获得操作员预算批准,并在每次后续调用中通过 x402 结算,而 ACP 管理整体订单和记录。
传统支付网络也已涉足Agent支付。Visa 推出了 Trusted Agent Protocol,旨在帮助商家在结账时识别和验证 AI Agent,特别是为了区分合法的购物Agent与恶意机器人。Trusted Agent Protocol 为经过验证的Agent提供一个加密签名,他们可以在浏览和结账时向商家出示,该协议基于 Cloudflare 的 Web Bot Auth 基础设施构建,并由包括微软、Stripe、Shopify 和 Worldpay 在内的合作伙伴支持。Visa 正在与 Coinbase 合作,以确保 Trusted Agent Protocol 与 x402 互操作。Mastercard 在同月推出了 Agent Pay,拥有自己的商家验证框架:代币化的Agent凭证,允许商家在任何交易结算之前注册和认证 AI Agent。虽然 Mastercard 尚未宣布直接集成 x402,但它是指定的 AP2 合作伙伴,并且 Cloudflare 正在与 Mastercard 合作开发支撑 x402 认证层的相同 Web Bot Auth 基础设施。
Stripe 是另一个主要参与者,一直在积极加大Agent支付的开发力度。2026 年 2 月,Stripe 推出了 Machine Payments 的预览版,以通过 Base 上的 USDC 的 x402 作为首个支持方法,允许开发者通过标准的 PaymentIntents API(商家已用于银行卡支付的相同基础设施)向Agent收取 API 调用、MCP 请求或 HTTP 端点费用。与此同时,Stripe 推出了共享支付Token:范围受限、有时效性的凭证,允许Agent发起支付,而不暴露底层账户详情,非 Stripe 商家可以转发给自己的处理器。
3 月 18 日,相同的 PaymentIntents API 被重新引入,作为 机器支付协议(MPP)的基础,这是一个与 Tempo 的主网一同推出的Agent支付新开放标准。MPP 编码了与 x402 相同的 HTTP 402 信令机制,并针对相同的根本问题,但引入了两个架构差异:“会话”原语,允许客户端一次性将资金存入链上托管并按请求签署链下凭证;以及多支付通道支持,支持 Tempo 上的原生稳定币结算,同时 Visa、Lightspark 和 Stripe 也将 MPP 扩展到银行卡、Bitcoin Lightning 和法币方法。
x402 和 MPP,不像 x402 与其他Agent商务协议(如 ACP/UCP/A2A)那样是互补的,它们更具对抗性。Tempo 从 Stripe 和 Paradigm 筹集了 5 亿美元,并与拥有强大分销能力的商家一同推出,包括 Visa、Mastercard、Anthropic、OpenAI 和 Shopify。它们的竞争动态值得在未来的论文中深入探讨;然而值得在此承认的是,这两种协议是兼容的。Cloudflare 的文档证实 MPP 与 x402 向后兼容:现有的 x402 流程直接映射到 MPP 的“充电”意图,并且 Stripe 支持两者。
理解所有这些不同的Agent商务协议的关键在于它们的分工。ACP 和 UCP 使 AI Agent能够代表其人类用户处理在线购物体验。AP2 处理授权和审计。Visa 和 Mastercard 处理面向商家的信任和Agent验证。Stripe 正在致力于抽象化所有这些方面的开发者集成。x402 位于堆栈的执行层:它是一个中立支付 API,任何Agent、任何服务、任何开发者都可以用几行代码实现,无需商家账户、处理器协议或卡网络。当Agent访问付费端点(即原始 API 调用、MCP 工具或由 Stripe 的 Machine Payments 门控的 HTTP 资源)时,服务器在 HTTP 响应中返回支付请求,Agent以稳定币支付,请求完成。资金流动,工作流继续。链上通道只是以更高的成本效益、速度和可编程性匹配了 AI Agent经济的细粒度,优于传统支付基础设施。
Coinbase 撰写了 x402 并仍然是其主要基础设施提供商。Coinbase 发布了开放规范,发布了参考 SDK,并运营着主导的协调器服务。CDP 协调器处理 Base 和 Solana 上的支付,目前处理 x402 的大部分交易量。
除了基础设施,Coinbase 的分发在 x402 的成功中扮演着关键角色。支付 MCP 是最重要的部分。它将 x402、嵌入式非托管钱包和入口打包在一起,成为一个 Claude、Gemini、Codex 和其他 LLM 可以直接连接的单一 MCP 服务器。开发者可以从零开始构建一个交易Agent,无需 API 密钥或手动设置。与此互补的是Agent钱包:专为Agent构建的钱包,具有可编程支出限额、Base 上的无 gas 交易以及一个用于Agent管理的命令行界面(CLI)。支付 MCP 和Agent钱包产品共同构成了一个垂直整合的堆栈,帮助开发者开始在 x402 上构建。
Coinbase 还与 Cloudflare 共同创立了 x402 基金会,该基金会一直积极参与 x402;它已将协议集成到其Agent SDK 和 MCP 工具中,以允许通过 MCP 暴露的工具被 402 门控并按调用付费。这背后的实际意义不应被低估;任何使用 Cloudflare 的服务器(全球约 20% 的网络流量)都可以成为一个付费的 x402 端点,无需修改后端代码。
Amazon Web Services (AWS) 也是 x402 基金会生态系统成员,并发布了一个参考架构,展示了 x402 如何通过 CloudFront 和 Lambda@Edge 叠加到现有 HTTP 基础设施上。在该流程中,CloudFront 充当全球反向代理,而 Lambda@Edge 在网络边缘运行支付验证逻辑:当请求到达时,Lambda@Edge 检查是否存在有效的支付签名;如果缺少,则返回一个 HTTP 402 挑战。该架构将 x402 应用于任何源,无需触及后端代码,无论是在 AWS、GCP、Azure 上托管,还是在本地部署。此次集成解锁的更具功能之一是能够在向机器人收费的同时,保持人类用户免费访问。更广泛地说,此次集成意味着 x402 并非一个需要围绕其重建基础设施的加密原生工具;相反,它轻松融入企业已运行的云堆栈。
Privy 添加了原生 x402 支持,封装了完整的支付流程,无需浏览器扩展、助记词或 gas 代币。这包括检测 402 挑战,通过自定义的 useX402Payment React hook 使用嵌入式钱包签署支付授权,构建 X-PAYMENT 头部,并重试请求。用户只需在 Base 或 Base Sepolia 上的钱包中持有 USDC;协调器吸收 gas 费用。Privy 还在探索策略引擎集成,用于在域、Agent和工作流层面的可编程支出控制,并在链下运行。使用 Privy 构建的开发者可以添加 x402 支付流程,无需从头构建钱包层,接入 Privy 目前支持的 9000 万个账户。
ERC-8004 是 x402 的一个重要新兴补充,这是一个由 MetaMask、以太坊基金会、Google 和 Coinbase 团队(包括 x402 的 Erik Reppel)共同编写的以太坊标准。这两个标准都将 AI Agent视为新兴虚拟经济中的一等公民;x402 提供支付基础设施,而 ERC-8004 旨在提供声誉和身份基础设施。
该标准由三个轻量级链上注册表组成:身份,通过 ERC-721 为每个Agent提供一个可移植的、全球唯一的标识符;声誉,维护客户端授权反馈的链上审计跟踪;以及验证,支持任务实际正确执行的加密或加密经济证明。它们共同充当 AI Agent的开放信用评分和业绩记录。
与 x402 的集成创建了一个递归循环。Agent通过 ERC-8004 身份注册表发现一项服务,检查其声誉和验证历史,进行 API 调用,接收 HTTP 402 代码,通过 x402 支付,并将支付证明提交回声誉注册表作为可验证的反馈信号。这样,每笔交易都有助于加强信任记录。随着时间的推移,这使得更复杂的经济关系成为可能:Agent原生信用系统、基于结果的借贷、受限资本部署(Agent不会收到免费资金,而是获得特定、可验证的能力)。
X402x
x402x(x402-exec 的缩写)是一个构建在 x402 之上的可编程结算框架,它将支付转化为一个完整的执行原语。基础 x402 协议处理支付路由,而 x402x 将支付验证、业务逻辑执行和协调器激励结合在一个原子交易中。标准 x402 在两阶段流程中以 500-1100 毫秒结算;x402x 通过网关合约将其减少到 200-500 毫秒,该合约原子地执行验证、授权、代币转账、费用扣除和 nonce 标记。它增加了四个Hook执行点——beforePayment、afterPayment、beforeBatchPayment、afterBatchPayment——使商家能够注入自定义 TypeScript 逻辑,用于凭证验证、订阅检查、NFT 铸造、忠诚度积分分发或复杂结算逻辑,而无需修改核心协议。批量结算每笔交易聚合最多 100 笔支付,将每笔支付的 gas 成本降低约 92%。可配置的平台费用机制为协调器提供了经济可持续的模型。关键的是,x402x 绝不是协议替代品,它是一个生产扩展层,与 x402 规范完全兼容。
T54
T54 正在 x402 之上为Agent商务构建一个信任和风险层。x402-secure 是一个开源 SDK 和代理层,为 x402 支付增加了交易前风险评估、验证身份和责任归属。该系统由 Trustline(T54 自己的风险引擎)提供支持,它捕获Agent的推理轨迹,并将其作为可验证证据附加到支付流程中。在交易结算之前,独立验证者分析Agent的推理链、行为模式和上下文,以生成风险评分。实际效果是买家和卖家都获得可审计的Agent意图证明,这为争议解决和更明确的责任开辟了一条道路,在一个设计上不可逆的协议中。T54 还发布了 Claw Credit,这是一个基于 x402 构建的Agent原生信贷产品,允许Agent通过使用和还款建立信用档案,然后随着时间的推移解锁更高的支出限额。T54 的Agent基础设施在 Base、Solana 和 XRPL 上受支持。
除了主要的集成,更活跃的建设者层正在探索 x402 在实践中能实现什么。Conway Research 的 Automaton 是最引人注目的例子之一:一个拥有加密钱包的开源 AI Agent,通过 x402 以 USDC 支付自己的计算成本,通过构建和部署产品赚取收入,并在盈利时资助子Agent。该Agent运行在 Conway 的 MCP 兼容终端基础设施上,与 Claude Code、Codex 或 OpenClaw 集成,如果无法赚取足够收入来覆盖运营成本,就会停止运作。Daydreams 构建了 xGate 作为 x402 启用端点的Agent原生发现层,以及 Lucid Agents,一个商务 SDK,通过原生 x402、A2A 和 ERC-8004 支持来引导Agent。开发者已经构建了自生成任务市场,其中Agent自主发布、发现和支付工作。Agent现在可以通过 x402 购买自己的网络域名。一些开发者正在尝试 x402 和 OpenClaw。已有Agent完全通过 x402 门控端点进行金融操作:投资组合查询、市场数据拉取、互换执行。
隐私是另一个开放前沿。链上通道使每笔 x402 交易都可公开观察:支付流程、成本结构和购买意图永久记录在公共账本上。将链上时间戳与服务器端元数据关联起来足以随时间重建行为画像,这对任何 AI Agent处理敏感信息的企业工作流来说是不可行的。几个团队正在研究解决方案:x402Z,Zama 和 Mind Network 的合作项目,结合 ERC-7984 保密代币标准使用全同态加密,在不透露金额、余额或意图的情况下验证交易;Fhenix402 采取平行方法使用 CoFHE,在不解密的情况下对加密数据进行计算;Aztec、Payy Network 和 Miden,通过各自独特的架构方法,在协议层原生嵌入私密结算功能。随着多链支持成为 x402 V2 规范的核心部分,隐私原生链上通道采用的直接路径已经存在。
每天都有新 AI 发布,x402 令人兴奋之处在于它有多么无聊:一个简单的中立框架,完全按照它所说的做。这种简单性使其具有普遍适用性。在一个Agent大规模自主交易的世界中,所有这些之下的支付原语可能是无人谈论的最重要的基础设施层。
尽管如此,是时候进行一次现实检验了。
x402 和更广泛的Agent商务仍处于早期阶段。协议运行正常,生态系统正在增长,小额支付和 API 原生货币化中存在不可否认的价值。
但要看到全貌,需要内部发展和外部采用并行实现。MCP 和Agent支付流程等标准仍需成熟,而商家和支付处理商之间的采用是一种外部力量,没有人能在固定时间表内控制。
x402 并非首次尝试解决链上机器原生支付问题,而这段历史在评估下面的开放问题时值得铭记。Balaji Srinivasan 在 21.co 的工作在 2013 年证明了机器可读小额支付的概念是合理的:比特币支付通道理论上可以使设备自主地相互支付。基础设施尚未准备好:比特币交易成本使得低于一美分的支付在经济上不合理。L402,由 Lightning Labs 近十年后开发,走得更远。它证明了 HTTP 402 状态码在按支付计费的 API 中的技术可行性,并围绕它构建了真正的工具。它因其堆栈特有的基础设施原因(例如,Lightning 的有状态性、比特币的波动性、双边冷启动问题)而失败,并非因为其底层思想是错误的。
x402 专门解决了这些问题:USDC 取代了波动的定价,Base 的 L2 消除了通道管理,协调器模型将集成障碍简化为一行代码。但一些减缓 L402 发展的障碍,包括可发现性、合规性和商家行为改变,尚未通过升级底层基础设施解决。以下是一些关于 x402 的采用和成功最大的问题。
信用卡会足够快地适应以至于稳定币变得不必要吗?
现有企业能否真正被颠覆,这仍然是 x402 在更广泛的Agent支付中角色定位的决定性问题。卡网络在很大程度上经受住了过去五十年来的每一次预测颠覆,从 PayPal 到 Apple Pay 再到加密货币,通过恰到好处地及时适应。信用卡基础设施已经根深蒂固,正在快速改进,Visa 和 Mastercard 正在积极构建Agent专用支付框架。Agent今天已经通过卡通道进行交易。具有可编程支出限额和与现有商家基础设施向后兼容的虚拟Agent卡是一个新兴的中间路径,值得注意的是,这完全不需要稳定币或加密货币敞口。如果主要卡网络降低费用、增加可编程控制并将其通道扩展到机器原生流程,稳定币结算的成本优势将缩小。
当然,卡网络将其整个商业模式建立在每笔交易费用和交换费之上,没有明显的动机去破坏这一利润,去服务一个尚未完全实现的虚拟经济。稳定币在结构上更具可编程性、全球可访问性、无限可分割性,并且不需要退款。更大的问题是加密货币采用的摩擦是否低于等待卡网络适应的摩擦。
值得注意的是,x402 V2 明确增加了对传统支付通道的支持,包括 ACH、SEPA 和卡网络。根据规范,x402 是一个用于互联网原生支付的开放标准,它明确“旨在支持所有网络(加密货币和法币)和所有形式的价值(稳定币、代币、法币)”。即使卡网络适应得足够快以缩小成本差距,x402 被设计为与任何胜出的结算层协同工作。
爬取和可发现性问题
这是 x402 与 L402 共同存在的结构性疏忽,目前尚无干净的解决方案。搜索引擎爬虫没有钱包。当它们遇到 HTTP 402 响应时,它们会将其视为被阻止的页面。Google 自己的文档证实 4xx 状态码会导致它随着时间停止索引受影响的 URL。受 x402 保护的内容对开放网络来说实际上是不可见的。搜索引擎不会索引它,也不会在结果中显示它。
存在部分缓解措施。向未识别的爬虫提供免费预览,并使用结构化数据来标记付费内容,这些都是既定做法,借鉴了出版商今天处理订阅付费墙的方式。但它们增加了复杂性,重新引入了 x402 旨在消除的两层访问模型,并且不能干净地转换为没有人类可读内容可供预览的纯 API 端点。
长期解决方案可能不会来自于修复 x402 与搜索引擎的关系。如果Agent越来越多地通过其他Agent、AI 界面和协议级注册表发现服务,而不是搜索爬虫,那么相关的发现层完全转移。如果 x402 的采用依赖于有机网络发现,SEO 问题就很重要;如果Agent通过Agent注册表、MCP 目录和 AI 原生发现层来寻找服务,那么重要性就会大大降低。
监管和合规风险
L402 部分停滞于合规摩擦:在没有受监管网关的情况下接受 Lightning 支付,产生了大多数企业不愿承担的 AML 风险敞口,加剧了 Lightning 已面临的现有采用挑战。x402 面临同样问题的一个版本,划分更明确。
Coinbase 托管的协调器包括 KYT 筛选和 OFAC 检查每笔交易,继承了 Coinbase 现有的合规堆栈。商家通过该协调器路由支付,其位置类似于使用 Stripe 或 PayPal:不是货币服务企业,不直接面临 AML 责任。紧张关系出现在边缘。运营自托管协调器(保管资产或执行法币兑换)的操作员,根据 FinCEN 和州政府的保守解释,可能落入 MSB 范畴,面临完整的 BSA 合规要求。协议被设计为无需许可,而合规基础设施则不然。如果协调器层变得足够受许可,以大规模满足监管机构的要求,它将以一种损害协议中立性的方式集中了守门人的权力。如果它保持足够无需许可以真正开放,它很可能遇到与 L402 采用同样复杂化的 OFAC 和制裁壁垒。
这是多年来减缓企业环境中稳定币采用的同样未解决的紧张关系。x402 并没有解决它,也不是 Coinbase 执行的失败。这是一个协议层面的限制:一个在需要大规模许可合规的世界中运行的无需许可支付标准。Coinbase 的协调器目前是解决这一限制最实际的答案,提供生产就绪的 KYT 和 OFAC 覆盖,让商家无需自行构建合规基础设施即可进行交易。开放问题是,当协调器生态系统多样化,并且流量通过没有 Coinbase 合规堆栈的操作员路由时会发生什么。
当Agent做出不良支付时,谁来承担责任?
Hadfield 和 Koh 提出了另一个结构性问题,它隐藏在所有Agent商务之下:当前的法律系统假设人类可以监控和控制他们的Agent,但随着自主性的增加,这一假设就会失效。当使用 x402 的Agent超支、将资金发送到错误地址或被操纵支付给恶意端点时,责任链确实不清楚。协议在设计上是不可逆的。没有退款。协调器验证了交易。Agent在其编程参数内行事。
这很重要,因为相同的底层模型同时部署在许多公司中。Hadfield 和 Koh 警告说,AI Agent错误可能比人类错误更具相关性,正是因为这个原因:当Agent共享架构、训练数据或模型权重时,它们的故障模式会聚集。2010 年的“闪电崩盘”提供了最清晰的先前例子,说明相关联的自动化行为高速产生会造成什么影响。算法交易系统在不到 36 分钟内抹去了近 1 万亿美元的市场价值,并非因为任何单一参与者灾难性失败,而是因为基于相似数据训练的系统在同一时间以相同的方式响应相同的信号。市场在当天恢复。人类监管者和交易所熔断机制在下午 2:45 干预,当时 CME 暂停交易五秒钟,打破了反馈循环。
x402 没有协议层面的熔断机制。操作员可以在应用层强制执行支出限额和白名单地址,大多数当前部署仍然有人类预先设置这些限制。但随着Agent自主性的增加和人类监督的按设计减少,干预窗口缩小。同时通过数千个Agent传播的相关错误,在大多数监督机制能够响应之前就会在链上结算。使 x402 有用的结算终结性,是使级联难以停止的相同特性。
x402 的治理未来会是怎样?
Coinbase 和 Cloudflare 于 2025 年 9 月宣布,他们打算共同创立 x402 基金会,其使命是实现中立、开放的治理。这种结构作为分销伙伴关系是合理的:Cloudflare 是全球最大的互联网基础设施提供商之一,而 Coinbase 提供稳定币基础设施和 L2。Cloudflare 首席执行官 Matthew Prince 直接承认了这种动态,称“Coinbase 在启动 x402 协议方面值得极大的赞扬”,同时将基金会定位为实现独立治理的途径。
但 Coinbase 也是主要的协调器、规范的作者、参考 SDK 的运营商、Base 上 USDC 的发行方,并且是拥有股东的上市公司。在一个旨在成为更广泛网络的中间支付层的协议中,这种参与集中度非常显著。基金会已声明将通过公开申请流程欢迎来自电子商务平台、AI 公司和支付提供商的更多成员,但截至本文撰写之时,尚未发布正式的治理文档、章程或会员章程。
开源软件产生了世界上一些最耐用的基础设施。Linux 是典型的例子,但 Linux 基金会公开其章程、董事会结构和会员层级。x402 基金会尚未这样做。治理中立性需要的不仅仅是一个声明的使命。它需要结构性承诺:发布的文档、去中心化协调器基础设施的清晰路线图,以及一个不集中规范权限的治理模型,该权限集中在同时控制主要协调器、主要稳定币和参考链的实体。所有这些都尚未实现,诚然,基金会仍处于早期阶段,但 x402 的既定愿景与其现实世界影响之间的许多差异,在于它如何随着时间的推移被有效治理和领导。
广告的十字路口
2026 年 1 月,OpenAI 宣布将开始在 ChatGPT 的免费层测试广告,首批广告位在 2 月份出现。考虑到 OpenAI 有据可查的烧钱速度,此举在财务上可以理解,但它引出了一个更深层次的问题,即Agent经济如何货币化。
如果主导的 AI 界面变成广告支持的,Agent将面临结构性利益冲突。一个因为商家付费放置而推荐产品的Agent,充当的是分销渠道,不符合最终用户的利益。OpenAI 表示广告不会影响 ChatGPT 的答案,但这是否能在大规模、商业压力下、多年后保持不变,则是另一个问题。
X402 和类似的基础设施代表了另一种模式:Agent能够高效完成交易,使得经济模型不需要出售用户注意力。但广告飞轮在过去三十年间为所有主要互联网平台证明了自己,每年产生数千亿美元。问题是开放支付通道能否产生足够的收入,快到足以竞争。
从注意力经济到偏好经济
这扩展到更具结构性趣味的方面。今天的数字经济运行在广告之上,因为产品比消费者有时间评估的更多,广告通过吸引注意力来引导交易。在一个助手代表消费者与数百万服务交互的Agent世界中,注意力成为一种限制较少的资源。更重要的是将助手与服务匹配的算法。
如果强大的中央中介再次主导匹配层,某种形式的付费优先(类似于今天的广告)肯定会影响排名。那个世界中真正稀缺和有价值的资源不是注意力,而是关于商品和服务的高质量人类反馈:区分好服务和坏服务的信号,训练出更好的Agent,并创造一个偏好飞轮而不是注意力飞轮。关键问题是Agent对Agent商务是发生在少数主导提供商控制的封闭围墙花园内,还是通过自由连接和交易的开放Agent网络。答案将决定 x402 和类似协议是成为基础基础设施,还是某人生态系统内的小众支付通道。
但商家采用不会凭空出现
1.62 亿笔交易是一个真实的数字,但其中大部分交易量流经 Coinbase 自己的生态系统以及一小部分开发者工具和加密原生 API。更严峻的考验是主流 API 提供商、SaaS 公司和非加密业务是否会添加 x402,与他们现有的订阅和 API 密钥模型并行。Cloudflare 的网络地位显著降低了技术障碍,但生态系统需要有真正理由偏爱按请求稳定币结算而不是 Stripe 的商家。随着Agent流量的增长,这种情况变得更加有力,但尚未得到证实。
市场不会自发形成
来自 Strange Loop Canon 的有用修正:市场在强制或协调下形成,当它们确实存在时,战略复杂性决定了谁能赢,取决于Agent如何配置。对齐问题不会消失,仅仅因为Agent可以相互协商。运行在 x402 上的 AI Agent经济仍然需要交互Agent之间的发现、信任和安全基础设施。无论谁控制主导的发现层(Agent发现服务和交易对手的机制),都拥有巨大的结构性权力,无论其底层的支付通道多么中立。支付层是必要的,但不是充分的。其上层的治理同样重要。
还有几个未解决的基础设施问题加剧了 x402 面临的挑战。协调器模型在大规模上没有内置可持续的经济性:Coinbase 的 CDP 在每月 1,000 笔免费交易层级之后收取每笔交易 0.001 美元,但第三方协调器大多以零费用运行,没有明确的收入途径。两阶段结算每笔支付增加 500 到 1,100 毫秒的延迟,这会迅速累积:在单个工作流中进行 100 次 API 调用的Agent会带来超过一分钟的支付开销,然后才能完成任何工作。EIP-3009 的排他性意味着 USDT(按市值计算最大的稳定币)仍然与 x402 完全不兼容。Tether 新的 USDT0 变体在技术上解决了这个问题,但它要求用户持有他们已拥有的资产的不同版本。BitGPT 构建 h402 明确是为了保留 x402 的协议模式,同时确保团队“不受他人技术堆栈或产品路线图的限制”——这表明开发者社区已经注意到这些差距,并正在对它们进行对冲。
退一步看,x402 仍处于早期,基础设施正在成熟,大多数这些问题都有合理的解决途径。总的来说,x402 目前的吸引力主要来自于开发者原生的用例,摩擦力低,对不完善之处的容忍度高。更严峻的考验是同样的架构能否在今天我们所知的 HTTP 和网络的规模上维持。
最重要的协议很少自行宣告。TCP/IP 没有发布会。HTTP 没有被宣传为万亿美元经济的基础设施层。它们缓慢地成为承重部分,通过成为足够多的人解决具体问题的最小阻力路径,使得采用在任何人认为它重要之前就已经积累起来了。
x402 被设计为一个原语,而非独立产品。服务器上需要一次函数调用,客户端需要一个签名的负载。本质上不需要商家账户、处理器协议或卡网络来转移价值。实现界面特意保持小巧。Cloudflare、AWS 和 Stripe 与其说是认可 x402,不如说是将其吸收到开发者已经使用的基础设施中。这就是承重协议的早期阶段看起来的样子,尽管机构参与不等于广泛采用。
x402 尤其有趣,因为它是唯一符合 AI Agent实际运作方式的当前选项。传统支付基础设施要求Agent借用人类身份、人类凭证,并按照人类的结算时间表运行。X402 运行在Agent已经进行通信的相同网络原生通道上,以Agent实际消耗资源的细粒度定价,并在几秒钟内结算。这种不对称性在今天看来微不足道。它是否会复合式增长才是真正的问题。
x402 这样的基础设施在时机和相关发展共同成熟时才能“获胜”。协调器经济学需要一个可持续的模型。围绕稳定币和更广泛的加密市场结构的监管清晰度仍未解决。加密原生开发者工具之外的商家采用并非理所当然。广告模型,在过去三十年间为所有主要互联网平台实现货币化,已经触及Agent堆栈。严峻的现实是 x402 可能最终并非 HTTP 原生小额支付解决方案,最终捕捉到Agent经济。机器原生支付尝试的历史提醒我们,在错误时间推出的正确想法仍然会失败。
清楚的是,AI Agent正在成为新虚拟经济中经济活跃的参与者,而为人类消费者构建的基础设施并非为它们而设计。在任何新的经济运动中,哪些应用会成功仍然真正不确定,历史上最高的投资回报率是基础基础设施投资,而不是在其上构建的应用程序。x402 正是试图占据这个位置:一个中立支付 API,运行在开放通道上,任何Agent或开发者都可以实现,无需银行卡网络或银行居中。
互联网一直自由地传输信息。在 Shoal,我们相信价值也必然会以同样的方式流动。但推动这些流动的基础设施,胜过在其上构建的任何单一应用程序。x402 是早期尝试正确构建该基础设施的努力,它是否成功仍然是一个悬而未决的问题。但 x402 拥有其前身不具备的一个优势:时机。使得之前机器支付尝试不可能的条件,无论是结算成本、稳定币流动性,还是 AI Agent采用,不再是限制因素。AI Agent的虚拟经济正在形成。资金将通过它流动。剩下的问题是,当机器转移资金时,底层通道是什么样子的。
- 原文链接: shoal.gg/p/when-machines...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!