登链社区

构建可长时间运行 Agent 的实践与思考

**视频 AI 总结**：本视频来自 Anthropic 应用 AI 团队的工程师 Ash 和 Andrew，分享了构建能够长时间运行（数小时甚至数天）的 AI Agent的实践与思考。他们回顾了 Claude Code 从一次性编码工具到支持多日持续运行的演进历程，分析了长时代理面临的上下文有限、规划困难、自我评价偏差等挑战，并重点介绍了他们采用生成器-评估器对抗模式（类似 GAN）来提升代码和设计质量的实验性方法。视频还讨论了如何设计评估器、使用 Playwright 进行自测试、通过文件系统管理状态以及根据模型能力演进简化 harness 设计。 **主要内容**： - 长时运行代理的三大挑战：上下文有限（记忆缺失、上下文腐烂、焦虑）、规划能力差、模型难以客观评判自身输出。 - 应对策略：通过模型权重提升（如 Opus 4.6 支持 12 小时连续运行）和改进 harness 工具（如 Agent SDK、检查点、技能、服务器端压缩）协同进化。 - 核心模式：生成器-评估器对抗模式，将构建与评价分离，让评估器通过 Playwright 实际操作用户界面进行测试和评分。 - 引入计划器角色，将模糊需求分解为高层次规范，并通过生成器与评估器协商达成具体合同（contract），确保测试可量化。 - 实际案例对比：同样指令“构建一个复古游戏编辑器”，简单循环仅能生成半成品游戏（点击无响应），而对抗式 harness 生成了完整可玩的游戏，并包含 AI 辅助功能。 - 调优经验：手动阅读代理运行日志是调试的关键，通过记录评价标准（设计、原创性、工艺、功能）并权重调整来提升品味。 - 模型演进对 harness 的影响：随着模型能力提升（如 Opus 4.6 消除上下文焦虑），可以简化 harness（减少会话重置、降低评估频率），但对抗式评价模式仍然重要。

14 0 0 1 天前

使用 Claude Code 构建主动式智能体工作流

视频 AI 总结：Anthropic 的 Maya 介绍了 Claude Code 的新功能 routines，旨在将 Claude 从被动等待用户输入的编码工具转变为主动的编码队友。Routines 允许开发者通过定义提示、连接仓库和触发器，在 Claude Code 的托管基础设施上自动运行远程会话，支持定时或基于 GitHub 事件等触发方式。该功能解决了构建主动代理时面临的基础设施、触发和人机交互等挑战。Maya 以内部文档自动化创建为例，展示了如何设置 routines 来定期审查代码变更并更新文档，并强调了可实时监控和操纵会话的优势。视频鼓励开发者立即使用 routines 自动化重复性工作流程。关键信息：1. Routines 是 Claude Code 的新自动化功能。2. 支持定时和事件触发（如 GitHub issue）。3. 运行于托管基础设施，无需本地机器。4. 可实时查看和操纵会话。5. 实际案例：自动化文档更新。6. 适用场景包括部署验证、on-call 调查等。

128 0 0 2026-06-24 09:23

Claude Code Subagents

视频 AI 总结：本视频讲解了在 AI 编程助手 Claude Code 中如何有效使用子代理（subagents）。核心原则是：当中间探索工作对主线程不重要时，子代理能提升效率和上下文管理；反之，若每一步依赖上一步发现，则子代理可能导致信息丢失。子代理适合研究、代码审查、特定风格任务，应避免“专家声明”、多步流水线和测试运行器。设计有效子代理需定义结构化输出、报告障碍、限制工具权限，并通过 YAML 前端 Markdown 文件创建。关键信息： 1. **使用时机**：探索与执行分离时子代理有用；依赖发现步骤的任务不适合。 2. **优点**：隔离中间工作，清理主上下文窗口，返回摘要。 3. **应用场景**：代码研究（只取答案）、代码审查（分离视角）、文案/样式任务（定制系统提示）。 4. **误区**：声称专家（无价值）、顺序流水线（步骤依赖时失败）、测试运行器（隐藏诊断细节）。 5. **设计要点**：定义输出格式、报告障碍、具体描述、限制工具权限（如只读）。 6. **创建方法**：使用`/agents`命令或手动编辑 Markdown 文件（含 YAML 前端：名称、描述、工具、模型、系统提示体）。

167 0 0 2026-06-22 23:42

Claude Code Skills

视频 AI 总结：本视频详细介绍了 Claude Code 中的“技能（Skills）”功能。技能是一种 Markdown 文件，用于一次性教会 Claude 特定任务的知识（如代码审查标准、提交信息格式），之后 Claude 会在相关场景自动应用。技能按需加载，依靠名称和描述进行语义匹配，不会占用全部上下文窗口。视频还讲解了技能的存储位置（个人、项目、插件、企业及其优先级），如何排查常见问题（不触发、不加载、冲突、运行时失败），高级用法（允许工具、模型字段、渐进式披露），以及如何创建和分享技能。最后对比了技能与 .claude.md、子代理、Hook等定制方式的适用场景。 **关键信息：** - 技能是 Markdown 文件，通过描述自动匹配请求，按需加载，不浪费上下文。 - 存储优先级：企业 > 个人 > 项目 > 插件。同名高级别优先。 - 故障排查重点：描述是否匹配、路径文件名是否正确、是否被高层级技能覆盖。 - 高级字段：allowed_tools（限制工具）、model（指定模型）；建议使用渐进式披露（skill.md 控制在 500 行内，引用外部文件）。 - 子代理不会自动继承技能，需在 agent.md 中显式列出；内置代理（Explore/Plan/Verify）无法使用技能。 - 适用场景：技能用于任务特定知识；.claude.md 用于始终有效的项目标准；Hook用于事件驱动操作；MCP 提供外部工具。

203 0 0 2026-06-21 21:31

借助 AI 简化 Hedera 上开发

视频 AI 总结：视频主要介绍了 Hedera 为开发者构建的一系列工具，包括插件、技能和 MCP 服务器，旨在简化在 Hedera 平台上的开发流程。核心内容是帮助开发者，特别是黑客松参与者，高效构建项目的“黑客松助手”插件，它提供项目需求文档（PRD）生成和提交验证功能。视频还演示了插件的安装和使用，并公布了多个与 AI、代币化和原生服务相关的开发奖金项目，以及一个用于跨链数据整合的 Nario 工具。关键信息： 1. **Hedera 开发者工具包：** 提供一系列插件和技能，帮助开发者在 Hedera 上构建应用。 * **Hedera Agent Kit 插件：** 适用于 AI 代理，支持 HBAR 转账、代币创建和链上数据读取。 * **Dev Intelligence 插件：** 包含项目脚手架、质量门和会话管理技能，其中“黑客松助手”是核心，用于辅助 Hedera 上的项目开发。 * **Native Services 插件：** 包含 Hedera 代币服务（HTS）和 Hedera 共识服务（HCS）技能，便于与 Hedera SDKs 集成。 * **System Contracts 插件：** 用于 HTS 系统合约，支持代币铸造和调度服务。 2. **黑客松助手技能（Hackathon Helper Skill）：** * **Hackathon PRD：** 帮助开发者构建项目想法，并根据评判标准优化项目以获得高分。 * **Validate Submission：** 在提交前验证项目，确保正确集成 Hedera。 3. **安装与使用：** 插件可通过“plugin marketplace add Hedera Skills”轻松安装，并支持自然语言交互生成 PRD。 4. **MCP (Mintlify Content Portal)：** 已集成到 Hedera 文档网站，与插件协同工作，提供文档支持。 5. **开发奖金项目：** * AI 和代理支付：总奖金 $6,000（2 名获奖者）。 * Hedera 上的代币化：每人 $1,250（2 名获奖者），**仅限 Hedera SDKs，不允许 Solidity**。 * 原生服务：每人 $1,000（3 名获奖者），**仅限原生服务，不允许智能合约**。 * IO Builders/Nario 奖金：第一名 $2,000，两名亚军各 $750。 6. **Nario 工具：** 用于从 Hedera 及其他账本（如 Ethereum）获取和关联数据，实现跨链数据叙事，开源。

134 0 0 2026-04-22 12:58