一位开发者站在由代码方块、数据管道和工具图标组成的透明架构平台上,远景是深邃的数字星空,蓝色的AI光芒从平台中心向上升起,象征OpenAI Agents SDK为开发者提供坚实的底层架构支撑

OpenAI正在为 Agents SDK 引入全新功能,旨在为开发者提供一套标准化且易上手的底层架构

一个巨大的天平,左边是各种技术工具(代码文件、终端、API接口),右边是简洁统一的标准化架构方块,天平正缓缓向标准化架构倾斜,周围漂浮着各种开发工具的小图标

在人工智能快速渗透各行各业的当下,构建一个真正实用的AI智能体,仅有一流的大模型远远不够。开发者们迫切需要一套完备的基础设施,来支撑智能体执行文件审查、运行指令、编写代码以及跨步骤的长效协作。然而现实情况是,从原型开发迈向生产环境的道路上,开发者们往往面临各种艰难的权衡:模型无关框架虽然灵活,却无法充分释放前沿模型的性能潜力;模型厂商提供的SDK虽然契合度更高,但对运行框架内部的可见性往往不足;而托管型智能体API虽简化了部署,却限制了智能体的运行环境及对敏感数据的访问权限。

今天,OpenAI正式推出了Agents SDK的全新升级,旨在为开发者提供一套专为OpenAI模型量身打造的标准化底层架构。这套架构包含模型原生运行框架(model-native harness)和原生沙箱执行环境两大核心模块,前者支持智能体在计算机上跨文件、跨工具作业,后者则确保各类任务运行的安全性。换句话说,开发者现在可以更加专注于构建智能体的业务逻辑,而将繁琐的核心架构维护工作交给SDK来处理。

为什么智能体需要更好的基础设施

理解这次升级的意义,首先需要看清当前智能体开发面临的核心困境。

在实际生产环境中,一个有价值的智能体往往需要同时处理多种复杂任务:读取和分析文档、执行系统命令、编写和运行代码、与外部工具进行交互——这些操作横跨多个系统,需要在长周期任务中保持状态的连贯性。传统的开发方式存在明显的局限性:开放框架虽然给了开发者最大的自由度,却难以针对特定模型进行性能优化;厂商提供的SDK虽然与模型契合,但运行框架黑盒化导致调试困难;托管服务虽然开箱即用,却在安全性和灵活性上大打折扣。

这种种权衡反映出一个根本问题:智能体需要一个既能得到模型深度优化、又能提供足够可见性和控制力的运行框架。OpenAI此次发布的Agents SDK,正是为了解决这一痛点。

更强劲的智能体循环运行框架

升级后的Agents SDK运行框架为处理文档、文件和系统的智能体提供了显著增强的能力。该框架目前已集成可配置记忆模块、沙箱感知编排功能、类Codex的文件系统工具,以及针对前沿智能体系统常用原语(primitive)的标准化集成。

具体而言,这些原语包括:

  • 工具使用:通过MCP(Model Context Protocol)实现与外部工具的标准化连接
  • 技能(Skill):通过Agents Skills实现渐进式功能披露
  • 自定义指令:通过AGENTS.md文件定义智能体行为规范
  • 代码执行:通过Shell工具运行系统命令
  • 文件编辑:通过Apply Patch工具进行批量文件修改

这套框架的核心理念是让执行方式与前沿模型的最佳性能模式对齐,从而帮助开发者进一步释放模型潜力。这种设计使智能体能更贴合模型的“自然运行模式”,在执行复杂任务时——尤其是那些需要跨多种工具系统协作的工作或长周期任务——表现出更卓越的可靠性与性能。

一只优雅的蓝色机械鹤(代表AI模型)正在展翅飞翔,它的飞翔轨迹与一条彩虹般的道路完美重合,道路上布满了各种工具和系统,鹤的影子投射在道路上形成完整的覆盖,象征执行方式与模型最佳性能的完美对齐

同时,Agents SDK在设计之初就充分考虑了多样性和灵活性的需求。它为开发者提供了一个既能开箱即用、又具备高度定制空间的运行框架,支持开发者根据自身技术栈轻松配置工具调用、记忆模块及沙箱环境。

原生沙箱执行环境

升级后的Agents SDK现已原生支持沙箱执行,这意味着智能体可以在受控的计算机环境中运行,并配备任务所需的全部文件、工具及依赖项。

对于许多实用的智能体而言,一个能够安全读写文件、安装依赖、运行代码及调用工具的工作空间至关重要。原生沙箱支持为开发者直接提供了这一执行层,无需再费力自行搭建。开发者既可以接入自有的沙箱环境,也能直接使用SDK支持的第三方平台,包括Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop以及Vercel等主流服务商。

为了确保环境在不同服务商之间具备可移植性,SDK还引入了Manifest抽象层来定义智能体的工作空间。开发者可以挂载本地文件、定义输出目录,并从AWS S3、Google Cloud Storage、Azure Blob Storage及Cloudflare R2等云存储服务商处导入数据。这套方案为开发者提供了一种标准化的方式,助力智能体从本地原型平滑过渡到生产部署。

运行框架与算力的解耦

在设计智能体系统时,安全性和可扩展性是必须预先考虑的核心问题。OpenAI此次架构升级的一个重要设计理念,是将运行框架与算力环境解耦,从而实现多重安全保障。

首先是安全性保障。通过这种解耦设计,可以有效确保凭据等敏感信息不会泄露至执行模型生成代码的环境中,有效防范提示注入(prompt-injection)和数据外泄(exfiltration)的潜在风险。

其次是持久性保障。由于智能体的状态已被外部化,即使沙箱容器发生宕机,也不会导致整个任务运行失败。凭借内置的快照(snapshotting)与重构(rehydration)机制,Agents SDK可以在原环境失效或过期时,在全新的容器中精准恢复智能体状态,并从最后一个检查点继续运行。

一个透明的智能体形象正在一个破碎的玻璃容器中提取自己的核心记忆球,将它递给另一个全新的安全容器,新容器发出温暖的绿色光芒,象征快照保存与状态重构机制

最后是可扩展性保障。在执行任务时,智能体可以灵活调用一个或多个沙箱,仅在必要时激活环境,将子智能体(sub-agent)路由至隔离环境中,并通过跨容器的并行作业来显著提升执行效率。

代码示例:构建一个数据分析师智能体

为了帮助开发者更直观地理解新SDK的使用方式,以下是一个完整的示例代码,演示了如何构建一个数据分析智能体:

# pip install "openai-agents>=0.14.0"

import asyncio
import tempfile
from pathlib import Path

from agents import Runner
from agents.run import RunConfig
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
from agents.sandbox.entries import LocalDir
from agents.sandbox.sandboxes import UnixLocalSandboxClient

async def main() -> None:
    with tempfile.TemporaryDirectory() as tmp:
        dataroom = Path(tmp) / "dataroom"
        dataroom.mkdir()
        (dataroom / "metrics.md").write_text(
            """# Annual metrics

| Year | Revenue | Operating income | Operating cash flow |
| --- | ---: | ---: | ---: |
| FY2025 | $124.3M | $18.6M | $24.1M |
| FY2024 | $98.7M | $12.4M | $17.9M |
""",
            encoding="utf-8",
        )

        agent = SandboxAgent(
            name="Dataroom Analyst",
            model="gpt-5.4",
            instructions="Answer using only files in data/. Cite source filenames.",
            default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
        )

        result = await Runner.run(
            agent,
            "Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
            run_config=RunConfig(
                sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
            ),
        )
        print(result.final_output)

if __name__ == "__main__":
    asyncio.run(main())

这个示例展示了一个典型的数据分析场景:开发者首先创建受控的工作空间并写入数据文件,然后初始化一个沙箱智能体并为其分配必要的工具和数据目录,最后通过自然语言指令让智能体完成数据分析任务。整个过程体现了Agents SDK的核心设计理念——提供标准化、模块化的基础设施,同时保持足够的灵活性

来自合作伙伴的验证

新SDK的能力已经得到了多家合作伙伴的实际验证。在法律领域,Oscar Health和LexisNexis等机构正在进行深度测试。在金融领域,FurtherAI和Thomson Reuters正在探索其在复杂文档处理中的应用。协作领域则有Zoom和Tomoro AI等合作伙伴。

Harvey应用研究负责人Niko Grupen分享了他的使用体验:

“GPT-5.4为处理大量文档的法律工作树立了新标杆。在BigLaw Bench评估中,它获得了91%的评分。与其他模型相比,GPT-5.4目前在构建复杂的交易分析、保持长篇合同准确性,以及提供法律从业者所需的高精度细节方面表现更佳。”

这一评价表明,当优秀的模型与完善的运行框架相结合时,智能体能够在专业领域展现出真正的实用价值。

定价与可用性

目前,Agents SDK的这些全新功能现已面向所有API用户开放。定价方案沿用标准API计费模式,根据Token使用量及工具调用次数进行结算。

未来展望

在Agents SDK的持续迭代中,OpenAI将不断拓宽其应用边界,助力开发者以更轻量化的基础设施,将性能更强的智能体投入生产,同时始终保障开发者所需的灵活性与掌控力。

从一片盛开的樱花树下望向远方,开发者的小女孩站在草地上手持一面镜子,镜子中映出越来越壮观的AI智能体城市天际线,高塔由代码和数据流构成,象征SDK持续迭代带来的无限可能

目前,全新的运行框架与沙箱功能已率先在Python版本中上线,TypeScript支持也已列入发布计划。此外,包括代码模式和子智能体在内的更多智能体功能也将逐步引入这两个语言版本。

展望未来,OpenAI希望进一步推动智能体生态的深度融合:通过支持更多的沙箱服务商、提供更丰富的集成方案,以及探索更多元化的接入方式,让开发者能够将SDK无缝嵌入其现有的工具链与系统之中。


核心要点总结

  • 模型原生运行框架:专为OpenAI模型优化,支持跨文件、跨工具作业,集成MCP、技能、AGENTS.md等标准化原语
  • 原生沙箱执行环境:提供受控工作空间,支持多平台部署,通过Manifest抽象层实现环境可移植性
  • 架构解耦设计:确保安全性、持久性与可扩展性,支持快照恢复和跨容器并行作业
  • 可用性:现已面向所有API用户开放,Python版已上线,TypeScript版开发中

原文媒体

一个示意图,展示了 Agent SDK 如何连接用户输入、模型和工具,以构建 AI 智能体。 一个示意图,展示了如何使用 Agent SDK 结合模型、工具和编排来构建 AI 智能体。 Daytona、E2B、Modal、Cloudflare、Vercel、Blaxel、Runloop 的徽标 流程图展示了 Agent SDK 如何使 AI 智能体能够利用额外计算资源来处理更复杂的任务。 一个示意图,展示了使用 Agent SDK 构建的 AI 智能体如何编排不同的计算系统,使工作负载能够独立运行,同时支持更高级的任务。

多个不同颜色的计算沙箱岛屿漂浮在数字海洋上,每个岛屿都是一个独立的工作空间,有山丘、树木和小屋,岛屿之间有数据桥梁连接,中央的主控塔发射光线将所有岛屿连接成一个协调的整体,象征智能体如何编排不同计算系统