4月8日,Anthropic正式发布Claude Managed Agents公测版。LangChain联合创始人Lance Martin在X上用一句话总结了它的定位:这是一个预构建、可配置的Agent运行框架,跑在托管基础设施上——你只需要定义Agent模板,剩下的全部由平台承担。
10x
Vibecode报告的开发效率提升
60%
P50首Token延迟降低
10h+
METR基准任务时间已超10人时
这不是又一个Agent框架。Claude Managed Agents解决的是一个困扰所有企业AI团队的核心痛点:从Demo到生产之间那条看不见的鸿沟。
为什么企业需要托管Agent基础设施?
过去一年,我们在帮助制造业客户落地AI Agent的过程中反复遇到同一个问题:Agent的业务逻辑只占工程量的30%,剩下70%全是基础设施——沙箱隔离、凭证管理、会话持久化、故障恢复、权限控制、执行追踪。一个能在Jupyter Notebook里完美运行的排产Agent,要真正上线需要再花3-6个月搭建这些"脚手架"。
Claude Managed Agents直接把这70%的工作变成了平台能力。
Lance Martin在文章中指出了两个推动这一变化的关键趋势:
第一,Agent框架跟不上模型进化速度。 所有Agent框架都内含对模型"不能做什么"的假设。这些假设随着Claude能力增长而过时,反而成为性能瓶颈。Martin此前专门写过一篇关于这个"苦涩教训"的博客——最好的Agent框架是那个能随模型一起进化的框架。
第二,Claude的任务时间线正在指数级增长。 METR基准测试显示,Claude已经能够完成超过10个人时的工作。这意味着Agent需要持续运行数小时甚至数天,对基础设施的可靠性、安全性和可扩展性提出了全新要求。
三个核心概念:Agent、Environment、Session
Claude Managed Agents的设计围绕三个概念展开:
| 概念 | 定义 | 类比 |
|---|---|---|
| Agent | 版本化配置:模型、系统提示、工具、技能、MCP服务器 | Docker镜像 |
| Environment | 沙箱模板:运行时类型、网络策略、包配置 | Dockerfile |
| Session | 有状态的执行实例:挂载资源、存储凭证、记录事件 | Docker容器 |
一个Agent可以启动多个Session。这种设计意味着你可以用同一个Agent配置,在不同的环境中并行处理多个任务。
Brain/Hands/Session:操作系统级的架构思维
Anthropic工程博客揭示了Managed Agents最精妙的设计理念——借鉴操作系统将硬件虚拟化为"进程"和"文件"的思路,将Agent系统解耦为三个独立层:
Brain(大脑)——Claude和它的编排框架(Harness)。Harness现在是无状态的,可以像cattle一样随时替换。崩溃后,新实例通过wake(sessionId)从最后记录的事件恢复。
Hands(双手)——按需创建的沙箱执行环境。容器不再预先绑定,而是通过工具调用按需启动。这消除了"所有资源必须和大脑在同一位置"的假设,企业可以将Claude连接到自己VPC中的资源。
Session(会话)——独立于上下文窗口的追加式事件日志。getEvents()接口支持灵活的上下文检索——可以从上次读取位置继续、回溯到关键时刻、或重新审视历史操作。
性能数据:TTFT降低90%
这种架构不仅更安全,还更快。由于推理可以在容器初始化之前就开始(Harness拉取待处理事件的同时,容器并行启动),首Token延迟(TTFT)大幅降低:
- P50 TTFT:降低约60%
- P95 TTFT:降低超过90%
内部测试还显示,在结构化文件生成任务上,Managed Agents的任务成功率比标准提示循环高出最多10个百分点。
四种典型使用模式
Lance Martin总结了四种企业级使用模式:
事件驱动型——外部服务触发Agent执行任务。例如:系统标记一个Bug,Agent自动编写补丁并开PR。从标记到行动之间无需人工介入。Sentry已经在用这种模式让调试Agent自动写补丁。
定时调度型——Agent按计划执行任务。例如:每日自动生成X/GitHub活动简报、团队Agent工作摘要。这与我们在FluxWise为客户构建的定时报表Agent高度相似。
即发即忘型——人类通过Slack或Teams分配任务,Agent返回交付物(电子表格、幻灯片、应用程序)。Notion的团队已经在工作区内直接委派工作给Agent。
长时任务型——持续运行数小时的复杂任务。Martin fork了Karpathy的auto-research仓库进行探索,让Managed Agent用chenglou的pretext库分析Anthropic工程博客内容。
谁已经在生产环境使用?
| 企业 | 场景 | 成果 |
|---|---|---|
| Notion | 工作区内委派任务 | 工程师发布代码,知识工作者生成网站和演示文稿 |
| Rakuten | 跨部门Agent部署 | 每个Agent一周内完成产品、销售、营销、财务部门部署 |
| Asana | AI队友协作 | 在项目中与人类并肩起草交付物 |
| Sentry | 调试自动化 | Agent自动编写补丁并提交PR |
| Vibecode | AI原生应用部署 | 开发效率提升至少10倍 |
快速上手
最简单的方式是通过Claude Code的技能系统:
$ claude update
$ claude /claude-api managed-agents-onboarding
也可以通过SDK(支持Python、TypeScript、Java、Go、Ruby、PHP六种语言)或CLI直接操作。常见模式是:用CLI做初始设置,用SDK做运行时集成——Agent模板以YAML形式存储在Git中,CLI在部署流水线中执行apply。
Claude的任务时间线还在指数级增长。未来的Agent将持续运行数天、数周甚至数月,处理人类面临的最大挑战。Managed Agents就是为这个未来准备的基础设施——而它今天就可以用了。
