释放人工智能代理：区块链如何实现真正的数字自主权

SeiNetwork
发布于 2025-02-14 11:40
阅读 1881

这篇文章详细介绍了人工智能代理的概念、架构及其与区块链技术的结合。文中探讨了AI代理的定义、工作机制，以及它们如何利用区块链实现自主性和经济独立，此外还涉及了传统Web2系统的限制和未来区块链基础设施对AI代理的重要性。文章结构清晰，信息丰富，引导读者思考未来技术的发展。

**想象一下，当你在一个夏日早晨醒来时，你生活中那些乏味而重复的事务已被处理好，你只需担心自己想做的事情。你的 AI 代理在为你交易并管理你的投资组合，能够为你提供必要的建议和预订，让你享受生活；你的预算得到平衡，咖啡是用你过去喜欢的咖啡豆根据你 AI 代理的建议冲泡的。在后台，自主 AI 代理利用区块链技术对交易进行认证，并在多个平台间转移价值，让你免受繁琐的官僚束缚。剩下的就是享受你的生活。**

### 什么是 AI 代理？

目前还没有一个普遍接受的 AI 代理定义。然而，像 IBM 和 AWS 这样的科技巨头将其描述为一种自主的、智能的系统，能够感知环境、做出决策，并采取行动以实现特定目标，而无需人类的持续干预。这些代理使用诸如机器学习和自然语言处理等 AI 技术，以便在动态环境中有效操作。

要理解什么是 AI 代理，比较它与标准软件是有帮助的。标准软件可以通过传感器（如摄像头、麦克风或端口监听器）感知环境，并且可以根据预定义的规则做出决策。它通常还有一个固定的预定义目标。

AI 代理的区别是什么？

主要区别在于代理性。AI 代理可以根据人类或其他代理给定的目标自行做出决策，而不是仅依赖其创造者定义的预先设定的规则。它可以学习和适应，因此其行为并不是严格预定义的。这些决策受政策指导——一组学习到的行为和限制，决定了代理如何追求其目标。虽然代理可以通过学习来完善其政策，但通常无法自行改变其基本目标，因为这些目标由其训练目标所决定。事实上，代理甚至可能拒绝执行某些操作，如果它确定这些操作与其目标不一致，这反映出一种传统软件所没有的自主性。这种自主性存在一个光谱，从完全自主系统到人机协作配置，在后者中，人类操作员保持不同程度的监督和控制。在一个极端，代理在其定义的边界内独立操作；在另一个极端，人类积极监视、验证并指导代理的决策过程，特别是在涉及重大战略决策时。

AI 代理：主动、自适应和互动（例如，从用户行为中学习）。

传统程序：遵循固定指令而没有自主性（例如，计算器）。

### 概念架构

- **数据获取/感知** \- AI 代理首先收集（或被提供）输入数据：用户查询、传感器数据或来自 APIs/数据库的结构化数据。根据用例，这可以是文本、图像、视频或其他传感器读取。
- **解释与推理** \- 代理使用模型（通常是 LLMs）处理输入，以提取意义和上下文。
  - 代理应用推理步骤——这可能是在基于 LLM 的代理中使用链式思维方法，或在强化学习系统中使用策略网络。
  - 根据设计，可能会使用额外的模块（例如，符号逻辑、知识图谱）来增强推理。
- **决策** \- 解释后的数据传递经过决策组件（例如，RL 策略、规划算法或特定神经网络）。代理根据其训练和目标选择最佳行动或响应。
- **行动/响应** \- 代理在其环境中执行动作或生成输出——这可以是文本回复、API 调用、控制命令给机器人等。

**学习与反馈回路** \- 许多 AI 代理结合了学习或微调机制（在线或离线），根据新数据和反馈进行更新。日志、用户互动或显式奖励/处罚可以反馈到训练中。

![替代文本: "流程图描绘了 AI 代理处理的五个阶段：数据获取、解释、决策、行动/响应和学习反馈，以循环工作流连接。每个阶段显示了 LLMs、知识图谱和规划算法等关键组件协同工作，将输入处理为最终输出。"](https://img.learnblockchain.cn/2025/03/05/Screenshot-2025-02-12-at-9.12.18-PM-1.png)标题: "AI 代理的认知架构"

### 基础设施组件

与基本的聊天机器人仅处理用户与 LLM 之间的单一交换不同，代理需要管理状态（存储对话历史和长期数据）、内存（保留多步信息）和工具执行（实际执行 LLM 建议的操作，然后返回结果）。由于这些任务需要多个移动部分——不仅仅是将文本发送到模型——因此出现了代理栈，以处理增添的复杂性。

未来，代理趋向于完全自主，设计、构建、部署、监视并改善其所需的整个技术栈。目前，我们处于一个阶段，即必须为 AI 代理提供绝大部分基础设施栈。

![替代文本: "时间线图显示 AI 基础设施演变的四个阶段，从以人为主到完全自主，阶段 1 和 2 之间有一个 '现在在这里' 的标记。每个阶段显示 AI 自主性增加和人类参与基础设施管理减少。"](https://img.learnblockchain.cn/2025/03/05/ai-timeline-1.png)标题: "AI 基础设施管理的演变"

为了使上述所有内容成为可能，典型的 AI 代理将依赖于某些基础设施要素：

1. **模型训练基础设施**

- 计算：用于大规模训练的 GPU（来自 NVIDIA、AMD 等）或专业硬件（TPU、自定义 ASIC）。
- 框架：PyTorch 或 TensorFlow 是最常用的深度学习框架。
- 存储：处理数据集（图像、文本语料等）和模型检查点的大量存储容量。

2. **推理基础设施**

- 模型托管/服务：一旦训练完成，模型将在一个能够快速加载和运行的环境中部署。这可以是本地服务器、云 GPU 实例、专业推理硬件或本地环境。
- APIs / 微服务：模型通常被封装在一个 API 层中，以便应用程序或其他服务可以实时发送数据并接收推理结果。
- 负载均衡与扩展：为了处理多个用户请求，容器化（Docker、Kubernetes）和负载均衡器确保可靠性和可扩展性。

3. **数据管道和工程**

- ETL/ELT 过程：系统如 Apache Spark、Airflow 或云数据管道将数据转换为适合训练或微调的格式。
- 数据湖/仓库：工具如 AWS S3、Google Cloud Storage、Azure Blob Storage、Snowflake 或 BigQuery 存储和管理大型数据集。
- 监控与日志记录：像 Prometheus、Grafana 或云原生监控解决方案等工具监视异常，测量延迟并收集日志。

4. **编排和代理框架**

- 代理框架是将 LLM 与外部工具、内存和执行环境连接的核心基础设施，处理上下文管理、工具集成和执行流。（LangChain、AutoGPT、BabyGPT）。
- 任务管理通过任务队列和调度器协调代理行动的执行。它处理异步操作、优先级调度、任务间的依赖关系和失败时的重试。
- 状态管理维护系统中的所有动态信息——从对话上下文到长期任务进度和代理内存。它处理临时状态（当前对话）和持久状态（学习的偏好），包括版本管理和回滚功能。
- 工具注册管理代理的可用能力和外部集成。它处理工具发现、注册、权限和执行监控。注册表维护每个工具的元数据，处理验证，并为代理与外部系统交互提供标准化接口。

5. **内存和状态管理**

- 向量数据库（Chroma、Pinecone、Weaviate、FAISS）：存储文本或其他高维数据的嵌入，以便代理能够回忆上下文、处理语义搜索或存储“记忆”。
- 传统数据库：关系数据库或 NoSQL 数据库用于管理结构化数据，如用户档案、系统配置等。

### 传统 Web2 系统对自主 AI 代理的局限性

传统 Web2 系统依赖于中心化和许可基础设施，为自主 AI 代理有效参与经济系统带来了挑战。依赖于云提供商、银行和身份验证服务等中心化机构造成瓶颈和脆弱性，因为代理在资源配置和身份管理等关键任务中依赖于人类监督。换句话说，某个银行、支付网关或供应商很可能会阻止来自位于自主性光谱右端的代理所发起的交易。

Web2 缺乏可验证计算或透明审计代理行为的机制，使得在关键经济互动中信任其决策变得困难。在没有内置透明度的情况下，代理的决策过程仍然不透明，限制了其在需要问责的体系中的实用性。虽然可解释的 AI 技术提供了一些对代理决策过程的洞见，但它们面临固有的挑战，依赖 Web2 封闭源实现则增加了额外的信任要求。将 AI 模型权重和计算移到链上通过加密验证和透明的模型架构提供了潜在解决方案，允许无信任审核代理的行为。

互操作性：Web2 系统是孤立的，这意味着代理很难在不同平台或经济生态系统中跨越交互，而无需大量人类干预。这种碎片化妨碍了它们在全球互联环境中无缝运作的能力。

最后，传统支付系统的局限性限制了代理自主转移价值的能力。慢速的交易速度、高昂的费用和对人类操作的银行基础设施的依赖，阻止代理实现真正的经济独立。

### 区块链支持完全自主的 AI 代理

消费者最终的用户体验偏好是能够代表其处理广泛任务的 AI 代理，从预订假期、寻找最具性价比的产品，到进行研究和创建工作演示。最有能力的代理——那些自主的、高度互联的、配备可扩展计算资源并能保持安全和隐私的代理——最终将赢得用户的信任和偏好。

AI 代理需要以下条件以实现完全自主：

- 身份和声誉
- 可扩展和可验证的计算
- 经济独立（无缝价值转移）
- 互操作性（多生态系统操作）
- 安全和隐私（数据和互动的完整性）

区块链消除对集中当局的依赖，使代理能够验证其身份、管理资源并安全互动。去中心化身份和声誉系统提供经过加密验证的凭证，使代理能够在没有人类干预的情况下建立信任。

它还通过零知识证明等机制实现可验证计算，确保代理的决策和行为可以进行审核以检查正确性，同时保护隐私，从而通过建立信任为代理行为打下基础。

互操作性使代理能够在不同的平台和经济环境中无缝操作。通过跨链协议，代理可以自主地在生态系统之间转移资产、凭证和数据，促进一个全球互联的系统。

基于区块链的支付系统赋予代理自主转移价值的能力。加密货币和基于Token的经济实现快速、经济和无需信任的交易，使代理能够直接支付资源、服务和基础设施，而无需征求许可。

![替代文本: "垂直堆栈图显示区块链基础设施的六个层次：支付与价值转移、智能合约、身份与声誉、安全与隐私、数据存储与检索，以及可验证计算。每层包含特定组件和技术。"](https://img.learnblockchain.cn/2025/03/05/Screenshot-2025-02-12-at-9.12.43-PM.png)标题: "AI 代理的区块链基础设施栈"

### 加入 Sei 研究倡议

我们邀请开发者、研究人员和社区成员加入我们的使命。这是为了建立更可扩展的区块链基础设施而发出的开源合作的公开邀请。查看 Sei 协议的 [文档](https://www.docs.sei.io/?ref=blog.sei.io)，并探索 Sei 基金会的资助机会（[Sei 创作者基金](https://blog.sei.io/creator-fund/)，[日本生态系统基金](https://blog.sei.io/sei-foundation-launches-50-million-japan-ecosystem-fund-to-boost-gaming-social-and-entertainment-sectors/)）。请联系 - collaborate\[at\]seiresearch\[dot\]io

参考资料：

[https://www.ibm.com/think/topics/ai-agents](https://www.ibm.com/think/topics/ai-agents?ref=blog.sei.io)

[https://techcrunch.com/2024/12/15/what-exactly-is-an-ai-agent/](https://techcrunch.com/2024/12/15/what-exactly-is-an-ai-agent/?ref=blog.sei.io)

[https://aws.amazon.com/what-is/ai-agents](https://aws.amazon.com/what-is/ai-agents?ref=blog.sei.io)

[https://www.letta.com/blog/ai-agents-stack](https://www.letta.com/blog/ai-agents-stack?ref=blog.sei.io)

[https://www.frontiersin.org/journals/blockchain/articles/10.3389/fbloc.2021.661238/full](https://www.frontiersin.org/journals/blockchain/articles/10.3389/fbloc.2021.661238/full?ref=blog.sei.io)

>- 原文链接： [blog.sei.io/unleashing-a...](https://blog.sei.io/unleashing-ai-agents-how-blockchain-enables-true-digital-autonomy)
>- 登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

想象一下，当你在一个夏日早晨醒来时，你生活中那些乏味而重复的事务已被处理好，你只需担心自己想做的事情。你的 AI 代理在为你交易并管理你的投资组合，能够为你提供必要的建议和预订，让你享受生活；你的预算得到平衡，咖啡是用你过去喜欢的咖啡豆根据你 AI 代理的建议冲泡的。在后台，自主 AI 代理利用区块链技术对交易进行认证，并在多个平台间转移价值，让你免受繁琐的官僚束缚。剩下的就是享受你的生活。

什么是 AI 代理？

AI 代理的区别是什么？

AI 代理：主动、自适应和互动（例如，从用户行为中学习）。

传统程序：遵循固定指令而没有自主性（例如，计算器）。

概念架构

数据获取/感知 - AI 代理首先收集（或被提供）输入数据：用户查询、传感器数据或来自 APIs/数据库的结构化数据。根据用例，这可以是文本、图像、视频或其他传感器读取。
解释与推理 - 代理使用模型（通常是 LLMs）处理输入，以提取意义和上下文。
- 代理应用推理步骤——这可能是在基于 LLM 的代理中使用链式思维方法，或在强化学习系统中使用策略网络。
- 根据设计，可能会使用额外的模块（例如，符号逻辑、知识图谱）来增强推理。
决策 - 解释后的数据传递经过决策组件（例如，RL 策略、规划算法或特定神经网络）。代理根据其训练和目标选择最佳行动或响应。
行动/响应 - 代理在其环境中执行动作或生成输出——这可以是文本回复、API 调用、控制命令给机器人等。

学习与反馈回路 - 许多 AI 代理结合了学习或微调机制（在线或离线），根据新数据和反馈进行更新。日志、用户互动或显式奖励/处罚可以反馈到训练中。

标题: "AI 代理的认知架构"

基础设施组件

标题: "AI 基础设施管理的演变"

为了使上述所有内容成为可能，典型的 AI 代理将依赖于某些基础设施要素：

模型训练基础设施

计算：用于大规模训练的 GPU（来自 NVIDIA、AMD 等）或专业硬件（TPU、自定义 ASIC）。
框架：PyTorch 或 TensorFlow 是最常用的深度学习框架。
存储：处理数据集（图像、文本语料等）和模型检查点的大量存储容量。

推理基础设施

模型托管/服务：一旦训练完成，模型将在一个能够快速加载和运行的环境中部署。这可以是本地服务器、云 GPU 实例、专业推理硬件或本地环境。
APIs / 微服务：模型通常被封装在一个 API 层中，以便应用程序或其他服务可以实时发送数据并接收推理结果。
负载均衡与扩展：为了处理多个用户请求，容器化（Docker、Kubernetes）和负载均衡器确保可靠性和可扩展性。

数据管道和工程

ETL/ELT 过程：系统如 Apache Spark、Airflow 或云数据管道将数据转换为适合训练或微调的格式。
数据湖/仓库：工具如 AWS S3、Google Cloud Storage、Azure Blob Storage、Snowflake 或 BigQuery 存储和管理大型数据集。
监控与日志记录：像 Prometheus、Grafana 或云原生监控解决方案等工具监视异常，测量延迟并收集日志。