Claude Managed Agents正式发布：企业AI Agent从原型到生产只需几天

4月8日，Anthropic正式发布Claude Managed Agents公测版。LangChain联合创始人Lance Martin在X上用一句话总结了它的定位：这是一个预构建、可配置的Agent运行框架，跑在托管基础设施上——你只需要定义Agent模板，剩下的全部由平台承担。

10x

Vibecode报告的开发效率提升

60%

P50首Token延迟降低

10h+

METR基准任务时间已超10人时

这不是又一个Agent框架。Claude Managed Agents解决的是一个困扰所有企业AI团队的核心痛点：从Demo到生产之间那条看不见的鸿沟。

为什么企业需要托管Agent基础设施？

过去一年，我们在帮助制造业客户落地AI Agent的过程中反复遇到同一个问题：Agent的业务逻辑只占工程量的30%，剩下70%全是基础设施——沙箱隔离、凭证管理、会话持久化、故障恢复、权限控制、执行追踪。一个能在Jupyter Notebook里完美运行的排产Agent，要真正上线需要再花3-6个月搭建这些"脚手架"。

Claude Managed Agents直接把这70%的工作变成了平台能力。

Lance Martin在文章中指出了两个推动这一变化的关键趋势：

第一，Agent框架跟不上模型进化速度。 所有Agent框架都内含对模型"不能做什么"的假设。这些假设随着Claude能力增长而过时，反而成为性能瓶颈。Martin此前专门写过一篇关于这个"苦涩教训"的博客——最好的Agent框架是那个能随模型一起进化的框架。

第二，Claude的任务时间线正在指数级增长。 METR基准测试显示，Claude已经能够完成超过10个人时的工作。这意味着Agent需要持续运行数小时甚至数天，对基础设施的可靠性、安全性和可扩展性提出了全新要求。

三个核心概念：Agent、Environment、Session

Claude Managed Agents的设计围绕三个概念展开：

概念	定义	类比
Agent	版本化配置：模型、系统提示、工具、技能、MCP服务器	Docker镜像
Environment	沙箱模板：运行时类型、网络策略、包配置	Dockerfile
Session	有状态的执行实例：挂载资源、存储凭证、记录事件	Docker容器

一个Agent可以启动多个Session。这种设计意味着你可以用同一个Agent配置，在不同的环境中并行处理多个任务。

Brain/Hands/Session：操作系统级的架构思维

Anthropic工程博客揭示了Managed Agents最精妙的设计理念——借鉴操作系统将硬件虚拟化为"进程"和"文件"的思路，将Agent系统解耦为三个独立层：

Brain（大脑）——Claude和它的编排框架（Harness）。Harness现在是无状态的，可以像cattle一样随时替换。崩溃后，新实例通过wake(sessionId)从最后记录的事件恢复。

Hands（双手）——按需创建的沙箱执行环境。容器不再预先绑定，而是通过工具调用按需启动。这消除了"所有资源必须和大脑在同一位置"的假设，企业可以将Claude连接到自己VPC中的资源。

Session（会话）——独立于上下文窗口的追加式事件日志。getEvents()接口支持灵活的上下文检索——可以从上次读取位置继续、回溯到关键时刻、或重新审视历史操作。

性能数据：TTFT降低90%

这种架构不仅更安全，还更快。由于推理可以在容器初始化之前就开始（Harness拉取待处理事件的同时，容器并行启动），首Token延迟（TTFT）大幅降低：

P50 TTFT：降低约60%
P95 TTFT：降低超过90%

内部测试还显示，在结构化文件生成任务上，Managed Agents的任务成功率比标准提示循环高出最多10个百分点。

四种典型使用模式

Lance Martin总结了四种企业级使用模式：

事件驱动型——外部服务触发Agent执行任务。例如：系统标记一个Bug，Agent自动编写补丁并开PR。从标记到行动之间无需人工介入。Sentry已经在用这种模式让调试Agent自动写补丁。

定时调度型——Agent按计划执行任务。例如：每日自动生成X/GitHub活动简报、团队Agent工作摘要。这与我们在FluxWise为客户构建的定时报表Agent高度相似。

即发即忘型——人类通过Slack或Teams分配任务，Agent返回交付物（电子表格、幻灯片、应用程序）。Notion的团队已经在工作区内直接委派工作给Agent。

长时任务型——持续运行数小时的复杂任务。Martin fork了Karpathy的auto-research仓库进行探索，让Managed Agent用chenglou的pretext库分析Anthropic工程博客内容。

谁已经在生产环境使用？

企业	场景	成果
Notion	工作区内委派任务	工程师发布代码，知识工作者生成网站和演示文稿
Rakuten	跨部门Agent部署	每个Agent一周内完成产品、销售、营销、财务部门部署
Asana	AI队友协作	在项目中与人类并肩起草交付物
Sentry	调试自动化	Agent自动编写补丁并提交PR
Vibecode	AI原生应用部署	开发效率提升至少10倍

快速上手

最简单的方式是通过Claude Code的技能系统：

$ claude update
$ claude /claude-api managed-agents-onboarding

也可以通过SDK（支持Python、TypeScript、Java、Go、Ruby、PHP六种语言）或CLI直接操作。常见模式是：用CLI做初始设置，用SDK做运行时集成——Agent模板以YAML形式存储在Git中，CLI在部署流水线中执行apply。

Claude的任务时间线还在指数级增长。未来的Agent将持续运行数天、数周甚至数月，处理人类面临的最大挑战。Managed Agents就是为这个未来准备的基础设施——而它今天就可以用了。

Claude Managed Agents正式发布：企业AI Agent从原型到生产只需几天

为什么企业需要托管Agent基础设施？

三个核心概念：Agent、Environment、Session

Brain/Hands/Session：操作系统级的架构思维

性能数据：TTFT降低90%

四种典型使用模式

谁已经在生产环境使用？

快速上手

相关文章

Blueprints and Formulas Collecting Dust on Servers: A 380% ROI Retrospective on AI-Activated R&D Knowledge in Chemical Enterprises

Quality Reports from 72 Hours to 8: A 16-Month Organizational Transformation with AI-Powered Quality Anomaly Closed-Loop at a Fluorochemical Group

Why a 2-Million-RMB Private LLM Deployment Lost to a 3,000-RMB-per-Month Intern

想了解更多？