跳到主要内容

2026-06-01 AI 周报

· 阅读需 4 分钟

覆盖周期:2026-06-01 至 2026-06-07。

本周判断
  1. Codex、GPT-Rosalind 和 Claude Partner Network 显示,Agent 正在从开发工具扩展到行业工作流。
  2. Project Glasswing 与 Anthropic 网络威胁报告把安全模型推向披露、补丁和攻击链治理。
  3. ChatGPT Dreaming、hf CLI、Holo3.1 和 OpenEnv 说明长期 Agent 需要记忆、CLI、环境和验证器。
  4. APB 把 Agent 评测从端到端成功率拆到规划诊断,评测粒度继续变细。

本周主线

Agent 从编码助手扩展到知识工作与垂直行业

OpenAI 6 月 2 日发布 Codex 角色插件、Sites 和 annotations,推动 Codex 从软件开发进入数据分析、销售、设计、投研和投行业务。6 月 3 日,GPT-Rosalind 更新把 GPT-5.5 的 Agentic coding 和 tool use 带入生命科学研究。Anthropic 则用 Claude Partner Network 的 Services Track 和 Partner Hub,把企业 AI 交付变成可审核的服务分层。

安全模型进入“能力释放 + 防滥用 + 补丁体系”阶段

Anthropic 6 月 2 日扩大 Project Glasswing,将 Claude Mythos Preview 扩展到约 150 个新组织。6 月 3 日的 AI-enabled cyber threats 报告又指出,恶意使用 AI 正从初始访问走向横向移动、账号发现和更自主的攻击链。高能力安全模型的关键不只是发现漏洞,而是验证、披露、修复、访问控制和安全护栏。

Agent 基础设施补齐记忆、CLI、环境和评测

OpenAI 更新 ChatGPT Dreaming,Hugging Face 推出更适合 Agent 的 hf CLI,Holo3.1 探索本地 Computer Use Agent,OpenEnv 则把开源 Agentic RL 的环境层推到前台。APB 提供 4209 个多模态规划案例,用来诊断长程规划、工具噪声、坏工具和不可解任务。Agent 要进入生产环境,模型之外的基础设施会越来越重要。


时间线

日期事件分类影响
06-01MiniMax M3 发布国内模型Agent 推理、工具调用、代码和长上下文成为旗舰能力
06-02Codex roles / Sites / annotations 发布知识工作 AgentCodex 从编程扩展到多岗位工作流
06-02Project Glasswing 扩容AI 安全Claude Mythos Preview 覆盖更多关键基础设施组织
06-03GPT-Rosalind 更新生命科学 AIGPT-5.5 工具调用能力进入药物发现和实验流程
06-03Anthropic 映射 AI 网络威胁安全治理AI-enabled attacks 正向后渗透链路和自主编排发展
06-04ChatGPT Dreaming 更新记忆 / 产品长期记忆进入更可扩展架构
06-04hf CLI for agents / Nemotron 3.5 Safety开源生态 / 安全平台 CLI 与安全模型服务长期 Agent
06-05Google 发布 5 月 AI recap平台生态Gemini 3.5 / Omni 主线被整合进 Google 全入口
06-06Agent Planning BenchmarkAgent 评测规划诊断成为端到端执行评测的前置层
06-07OpenEnv Agentic RL开源训练基础设施Agent 训练需要可复现环境和验证器

Sources


本周报基于 2026 年 6 月 1 日至 6 月 7 日自然周内已收录 AI 日报整理;所有信息均来自公开来源,不构成投资建议。