文章详细分析了 Moonshot AI、Cursor 和 Chroma 三家公司利用强化学习(RL)训练智能体(Agent)模型的技术路径。重点介绍了 Kimi K2.5 的并行智能体编排、Cursor 的实时生产环境 RL 与代码自摘要技术,以及 Chroma 的自编辑上下文检索模型,展示了提升智能体性能和效率的前沿方案。