Claude Code

微信扫码分享
构建可长时间运行 Agent 的实践与思考

构建可长时间运行 Agent 的实践与思考

**视频 AI 总结**:本视频来自 Anthropic 应用 AI 团队的工程师 Ash 和 Andrew,分享了构建能够长时间运行(数小时甚至数天)的 AI Agent的实践与思考。他们回顾了 Claude Code 从一次性编码工具到支持多日持续运行的演进历程,分析了长时代理面临的上下文有限、规划困难、自我评价偏差等挑战,并重点介绍了他们采用生成器-评估器对抗模式(类似 GAN)来提升代码和设计质量的实验性方法。视频还讨论了如何设计评估器、使用 Playwright 进行自测试、通过文件系统管理状态以及根据模型能力演进简化 harness 设计。 **主要内容**: - 长时运行代理的三大挑战:上下文有限(记忆缺失、上下文腐烂、焦虑)、规划能力差、模型难以客观评判自身输出。 - 应对策略:通过模型权重提升(如 Opus 4.6 支持 12 小时连续运行)和改进 harness 工具(如 Agent SDK、检查点、技能、服务器端压缩)协同进化。 - 核心模式:生成器-评估器对抗模式,将构建与评价分离,让评估器通过 Playwright 实际操作用户界面进行测试和评分。 - 引入计划器角色,将模糊需求分解为高层次规范,并通过生成器与评估器协商达成具体合同(contract),确保测试可量化。 - 实际案例对比:同样指令“构建一个复古游戏编辑器”,简单循环仅能生成半成品游戏(点击无响应),而对抗式 harness 生成了完整可玩的游戏,并包含 AI 辅助功能。 - 调优经验:手动阅读代理运行日志是调试的关键,通过记录评价标准(设计、原创性、工艺、功能)并权重调整来提升品味。 - 模型演进对 harness 的影响:随着模型能力提升(如 Opus 4.6 消除上下文焦虑),可以简化 harness(减少会话重置、降低评估频率),但对抗式评价模式仍然重要。

14 0 0 1 天前
使用 Claude Code 构建主动式智能体工作流

使用 Claude Code 构建主动式智能体工作流

视频 AI 总结:Anthropic 的 Maya 介绍了 Claude Code 的新功能 routines,旨在将 Claude 从被动等待用户输入的编码工具转变为主动的编码队友。Routines 允许开发者通过定义提示、连接仓库和触发器,在 Claude Code 的托管基础设施上自动运行远程会话,支持定时或基于 GitHub 事件等触发方式。该功能解决了构建主动代理时面临的基础设施、触发和人机交互等挑战。Maya 以内部文档自动化创建为例,展示了如何设置 routines 来定期审查代码变更并更新文档,并强调了可实时监控和操纵会话的优势。视频鼓励开发者立即使用 routines 自动化重复性工作流程。 关键信息:1. Routines 是 Claude Code 的新自动化功能。2. 支持定时和事件触发(如 GitHub issue)。3. 运行于托管基础设施,无需本地机器。4. 可实时查看和操纵会话。5. 实际案例:自动化文档更新。6. 适用场景包括部署验证、on-call 调查等。

128 0 0 2026-06-24 09:23
Claude Code Subagents

Claude Code Subagents

视频 AI 总结: 本视频讲解了在 AI 编程助手 Claude Code 中如何有效使用子代理(subagents)。核心原则是:当中间探索工作对主线程不重要时,子代理能提升效率和上下文管理;反之,若每一步依赖上一步发现,则子代理可能导致信息丢失。子代理适合研究、代码审查、特定风格任务,应避免“专家声明”、多步流水线和测试运行器。设计有效子代理需定义结构化输出、报告障碍、限制工具权限,并通过 YAML 前端 Markdown 文件创建。 关键信息: 1. **使用时机**:探索与执行分离时子代理有用;依赖发现步骤的任务不适合。 2. **优点**:隔离中间工作,清理主上下文窗口,返回摘要。 3. **应用场景**:代码研究(只取答案)、代码审查(分离视角)、文案/样式任务(定制系统提示)。 4. **误区**:声称专家(无价值)、顺序流水线(步骤依赖时失败)、测试运行器(隐藏诊断细节)。 5. **设计要点**:定义输出格式、报告障碍、具体描述、限制工具权限(如只读)。 6. **创建方法**:使用`/agents`命令或手动编辑 Markdown 文件(含 YAML 前端:名称、描述、工具、模型、系统提示体)。

167 0 0 2026-06-22 23:42
Claude Code Skills

Claude Code Skills

视频 AI 总结: 本视频详细介绍了 Claude Code 中的“技能(Skills)”功能。技能是一种 Markdown 文件,用于一次性教会 Claude 特定任务的知识(如代码审查标准、提交信息格式),之后 Claude 会在相关场景自动应用。技能按需加载,依靠名称和描述进行语义匹配,不会占用全部上下文窗口。视频还讲解了技能的存储位置(个人、项目、插件、企业及其优先级),如何排查常见问题(不触发、不加载、冲突、运行时失败),高级用法(允许工具、模型字段、渐进式披露),以及如何创建和分享技能。最后对比了技能与 .claude.md、子代理、Hook等定制方式的适用场景。 **关键信息:** - 技能是 Markdown 文件,通过描述自动匹配请求,按需加载,不浪费上下文。 - 存储优先级:企业 > 个人 > 项目 > 插件。同名高级别优先。 - 故障排查重点:描述是否匹配、路径文件名是否正确、是否被高层级技能覆盖。 - 高级字段:allowed_tools(限制工具)、model(指定模型);建议使用渐进式披露(skill.md 控制在 500 行内,引用外部文件)。 - 子代理不会自动继承技能,需在 agent.md 中显式列出;内置代理(Explore/Plan/Verify)无法使用技能。 - 适用场景:技能用于任务特定知识;.claude.md 用于始终有效的项目标准;Hook用于事件驱动操作;MCP 提供外部工具。

203 0 0 2026-06-21 21:31
借助 AI 简化 Hedera 上开发

借助 AI 简化 Hedera 上开发

视频 AI 总结: 视频主要介绍了 Hedera 为开发者构建的一系列工具,包括插件、技能和 MCP 服务器,旨在简化在 Hedera 平台上的开发流程。核心内容是帮助开发者,特别是黑客松参与者,高效构建项目的“黑客松助手”插件,它提供项目需求文档(PRD)生成和提交验证功能。视频还演示了插件的安装和使用,并公布了多个与 AI、代币化和原生服务相关的开发奖金项目,以及一个用于跨链数据整合的 Nario 工具。 关键信息: 1. **Hedera 开发者工具包:** 提供一系列插件和技能,帮助开发者在 Hedera 上构建应用。 * **Hedera Agent Kit 插件:** 适用于 AI 代理,支持 HBAR 转账、代币创建和链上数据读取。 * **Dev Intelligence 插件:** 包含项目脚手架、质量门和会话管理技能,其中“黑客松助手”是核心,用于辅助 Hedera 上的项目开发。 * **Native Services 插件:** 包含 Hedera 代币服务(HTS)和 Hedera 共识服务(HCS)技能,便于与 Hedera SDKs 集成。 * **System Contracts 插件:** 用于 HTS 系统合约,支持代币铸造和调度服务。 2. **黑客松助手技能(Hackathon Helper Skill):** * **Hackathon PRD:** 帮助开发者构建项目想法,并根据评判标准优化项目以获得高分。 * **Validate Submission:** 在提交前验证项目,确保正确集成 Hedera。 3. **安装与使用:** 插件可通过“plugin marketplace add Hedera Skills”轻松安装,并支持自然语言交互生成 PRD。 4. **MCP (Mintlify Content Portal):** 已集成到 Hedera 文档网站,与插件协同工作,提供文档支持。 5. **开发奖金项目:** * AI 和代理支付:总奖金 $6,000(2 名获奖者)。 * Hedera 上的代币化:每人 $1,250(2 名获奖者),**仅限 Hedera SDKs,不允许 Solidity**。 * 原生服务:每人 $1,000(3 名获奖者),**仅限原生服务,不允许智能合约**。 * IO Builders/Nario 奖金:第一名 $2,000,两名亚军各 $750。 6. **Nario 工具:** 用于从 Hedera 及其他账本(如 Ethereum)获取和关联数据,实现跨链数据叙事,开源。

134 0 0 2026-04-22 12:58