OpenAI 最强 AI 智能体编程模型:GPT-5.3-Codex 登场

2026-02-07 健励信息

OpenAI 昨日（2 月 5 日）发布公告，宣布推出 GPT-5.3-Codex，宣称这是其迄今最强的 AI 智能体编程模型。

相关基准测试结果如下：

在 SWE-bench Pro（公开版）测试中，该模型得分 56.8%，超越了前代的 56.4%；
在 Terminal-Bench 2.0 测试中，其得分从前代的 64.0% 大幅跃升至 77.3%；
最为显著的是在 OSWorld-Verified 智能体计算机操作基准测试中，得分从 38.2% 飙升至 64.7%，表明其在复杂环境下的操作能力实现了质的飞跃。
官方数据显示，该模型不仅在多项编程基准测试中创下新高，运行速度也比前代 GPT-5.2-Codex 提升了 25%。