跳到主要内容

GPT-5.5 测评

内容

GPT-5.5 的介绍、亮点与效果实测。

1. 模型介绍

OpenAI 在 2026年 4 月 23 日正式发布新一代模型 GPT-5.5

OpenAI 将其称为最智能、最直观易用的模型,也是在计算机上完成工作的新方式的下一步。

当天,GPT-5.5 正式向 ChatGPT 和 Codex 中的 Plus、Pro、Business 和 Enterprise 用户推出,GPT-5.5 Pro 也正式向 ChatGPT 中的 Pro、Business 和 Enterprise 用户推出。API 也会很快推出。


2. 模型亮点

OpenAI 在官方发布内容中提到 GPT-5.5 在下面几方面的能力提升:

  • 在智能体编码、计算机应用、知识工作和早期科学研究等领域的提升尤为显著
  • 实际应用中的 token 延迟与 GPT-5.4 相当,同时智能水平却更高
  • 它完成相同的 Codex 任务所需的 token 数量也显著减少
  • 配备了迄今为止最强大的安全保障措施

总体来说,GPT-5.5 在知识性工作、科学研究方面提升突出,推理效率也更高(特别是在与 Codex 的配合中),并且有最强大的网络安全防护措施。


3. 效果实测

下面我们就通过一些任务来测试一下 GPT-5.5 的模型效果。

在 codex + GPT-5.5(中等思考) 上使用中文提示词复现 OpenAI 官方在博文中的 "3D游戏" 任务实现。
使用 three.js 创建一个 3D 游戏。游戏内容应为 UFO 射击,玩家需要控制坦克击落头顶飞过的 UFO。

- 逐步思考,深呼吸。回答前,请复述一遍问题。
- 想象一下,你正在为一位即将开始构建游戏的初级开发者编写操作指南。你能否写出非常清晰明确的指南,包括他们需要查看哪些文件进行修改以及需要修复哪些文件?
- 然后编写所有代码。游戏采用低多边形设计,但要美观。
- 记住,你是一个 Agent :请持续处理用户的问题,直到问题完全解决后再结束你的回合并将选择权交还给用户。将用户的查询分解为所有必要的子请求,并确认每个子请求都已完成。不要只完成部分请求就停止。只有当你确信问题已解决时,才能结束你的回合。你必须做好回答多个查询的准备,并且只有在用户确认问题已解决后才能结束通话。
- 在进行后续函数调用之前,必须按照工作流程步骤进行充分的计划,并充分思考每次函数调用的结果,确保用户的查询和相关的子请求得到完全解决。

3D游戏

可以看到,GPT-5.5 能力非常全面,在各个任务上的表现都堪称优秀,配合上 Codex 则能作为 Agent 释放出更大威力。


参考