GPT-5.5 测评

内容

GPT-5.5 的介绍、亮点与效果实测。

1. 模型介绍

OpenAI 在 2026年 4 月 23 日正式发布新一代模型 GPT-5.5。

OpenAI 将其称为最智能、最直观易用的模型，也是在计算机上完成工作的新方式的下一步。

当天，GPT-5.5 正式向 ChatGPT 和 Codex 中的 Plus、Pro、Business 和 Enterprise 用户推出，GPT-5.5 Pro 也正式向 ChatGPT 中的 Pro、Business 和 Enterprise 用户推出。API 也会很快推出。

2. 模型亮点

OpenAI 在官方发布内容中提到 GPT-5.5 在下面几方面的能力提升：

在智能体编码、计算机应用、知识工作和早期科学研究等领域的提升尤为显著
实际应用中的 token 延迟与 GPT-5.4 相当，同时智能水平却更高
它完成相同的 Codex 任务所需的 token 数量也显著减少
配备了迄今为止最强大的安全保障措施

总体来说，GPT-5.5 在知识性工作、科学研究方面提升突出，推理效率也更高（特别是在与 Codex 的配合中），并且有最强大的网络安全防护措施。

3. 效果实测

下面我们就通过一些任务来测试一下 GPT-5.5 的模型效果。

3D游戏
数据分析
浏览器自动化
结合Images-2
GPT-5.5介绍视频

在 codex + GPT-5.5(中等思考) 上使用中文提示词复现 OpenAI 官方在博文中的 "3D游戏" 任务实现。

使用 three.js 创建一个 3D 游戏。游戏内容应为 UFO 射击，玩家需要控制坦克击落头顶飞过的 UFO。

- 逐步思考，深呼吸。回答前，请复述一遍问题。
- 想象一下，你正在为一位即将开始构建游戏的初级开发者编写操作指南。你能否写出非常清晰明确的指南，包括他们需要查看哪些文件进行修改以及需要修复哪些文件？
- 然后编写所有代码。游戏采用低多边形设计，但要美观。
- 记住，你是一个 Agent ：请持续处理用户的问题，直到问题完全解决后再结束你的回合并将选择权交还给用户。将用户的查询分解为所有必要的子请求，并确认每个子请求都已完成。不要只完成部分请求就停止。只有当你确信问题已解决时，才能结束你的回合。你必须做好回答多个查询的准备，并且只有在用户确认问题已解决后才能结束通话。
- 在进行后续函数调用之前，必须按照工作流程步骤进行充分的计划，并充分思考每次函数调用的结果，确保用户的查询和相关的子请求得到完全解决。

3D游戏

在 codex + GPT-5.5(中等思考) 上：
1. 整理一下这个 Excel 中的数据，生成几个新的sheet存入数据，要与关系型数据库适配
2. 对数据进行分析，将汇总的数据和结论放到新的 Excel 文件中。

GPT-5.5 将这个数据整理与分析任务拆成了 5 个子任务：
复制源 Exeel 到工作区副本
识别原始表结构和字段含义
新增关系型数据库适配sheet
新增数据质量与统计分析sheet
校验输出工作簿

已处理好：我复制了原文件，并新增了数据库适配与分析 sheet。

新增内容包括：
- db_asset_line：线路主表，59 条
- db_line_area_metric：区域长度明细，113 条
- db_operation_window：运行/暂停约束，16 条
- db_spare_inventory：备件库存匹配，172 条
- analysis_deep_dive：KPI、长度分布、库存 Top、规格分析
- data_quality_report：数据质量问题，22 条
校验结果：文件可正常打开，敏感词扫描为 0；质量报告里保留了异常点，比如区域长度不闭合、设计负载疑似录入错误、部分关键字段缺失等。

在 codex + GPT-5.5(中等思考) 上，并且安装了 chrome-devtools-mcp：
找一个在线数独页面，根据盘面填写答案。
要求：一步步填写，不能直接根据网页截图一步写出所有答案。

使用浏览器玩数独

在 codex + GPT-5.5(中等思考) 上：
参考 ai-basecamp.sparkhub.space 中 "Transformer架构" 的内容，使用 [$imagegen](...) 作成一张知识卡片

结合Images-2

在 codex + GPT-5.5(中等思考) 上，并且安装了 remotion-best-practices skill：
参考 https://openai.com/index/introducing-gpt-5-5/ 的内容，
使用 [$remotion-best-practices](...) 制作 1 分钟的视频 

可以看到，GPT-5.5 能力非常全面，在各个任务上的表现都堪称优秀，配合上 Codex 则能作为 Agent 释放出更大威力。

参考

Introducing GPT‑5.5 - OpenAI

1. 模型介绍​

2. 模型亮点​

3. 效果实测​

参考​

1. 模型介绍

2. 模型亮点

3. 效果实测

参考