- Anthropic 推出 Claude Corps,投入 1.5 亿美元培训 1000 名 fellows 服务 400+ 非营利组织。
- OpenAI 展示 Codex 辅助黑洞模拟,AI 编程工具进入高性能科学计算流程。
- Anthropic 同步把 AI 带来的劳动冲击纳入政策框架和社会投入。
- Claude Fable 5 护栏透明度争议提醒:最高能力模型发布需要可见的降级和拒答机制。
- OpenAI 与 Oracle 合作,OCI 客户可用既有云承诺访问 OpenAI 模型和 Codex。
- Google 发布 DiffusionGemma,26B MoE 文本扩散模型最高 4 倍更快生成。
- Gemini 面向小企业接入 Google Business Profile 和 Business notebooks。
- 企业 AI 竞争继续围绕采购路径、低延迟模型和业务上下文整合展开。
- Anthropic 发布 Claude Fable 5 和 Claude Mythos 5,最高能力模型分为公共版与可信访问版。
- Cohere 发布 North Mini Code,30B MoE 编码模型开放 Apache 2.0 权重。
- Google 发布 Gemini 3.5 Live Translate,支持 70 多种语言近实时语音到语音翻译。
- Google Co-Scientist 展示多 Agent 科学假设生成、辩论和演化流程。
- OpenAI 保密提交 S-1,前沿模型公司进入 IPO 准备阶段。
- OpenAI 发布 broad benefit plan,把公司治理与“广泛受益”叙事绑定。
- OpenAI Economic Research Exchange 启动,面向 AI 对工作、企业和经济影响的外部研究。
- 模型竞争正在同时进入资本市场、公共治理和经济测量阶段。
- 开源社区围绕 OpenEnv 推进 Agentic RL,强调可复现环境和工具调用训练。
- Holo3.1、hf CLI 和 GLM Coding Plan 等线索显示 Agent 训练与执行环境正在合流。
- Agentic RL 的核心不只是奖励函数,而是任务环境、工具接口和验证器能否稳定复现。
- 周末主线从单个模型发布转向 Agent 训练基础设施。
- Agent Planning Benchmark 提出 4209 个多模态规划案例,专门诊断 Agent 规划能力。
- APB 将失败拆到规划阶段,而不是只看端到端执行是否成功。
- 评测覆盖 22 个领域和 5 类设置,强调工具噪声、坏工具、不可解任务和拒答校准。
- 随着 Agent 进入生产环境,规划诊断会成为执行评测的重要前置环节。
- Google 发布 5 月 AI 更新汇总,把 I/O 2026 主线明确为 agentic Gemini era。
- Gemini 3.5 被定位为面向 Agent 和 coding 的 frontier intelligence。
- Gemini Omni、Universal Cart、Google Health 和硬件入口说明 AI 正进入日常任务流。
- Google 的路线不是单点模型发布,而是搜索、购物、健康、硬件和开发工具的系统整合。
- OpenAI 推出更可扩展的 ChatGPT memory dreaming 架构,改善长期上下文的新鲜度和相关性。
- Hugging Face 重新设计 hf CLI,使其更适合 Agent 访问 Hub、模型、数据集和作业。
- NVIDIA 在 Hugging Face 发布 Nemotron 3.5 Content Safety,强调可定制多模态安全。
- 记忆、CLI 和安全模型说明 Agent 基础设施正在补齐“长期运行”的底层能力。
- OpenAI 更新 GPT-Rosalind,把 GPT-5.5 的 Agent 编码和工具调用能力带入生命科学。
- Anthropic 基于 832 个恶意网络账号映射 AI-enabled cyber threats,指出攻击正在更自主。
- Claude Partner Network 推出 Services Track 和 Partner Hub,企业 AI 交付开始标准化。
- 生命科学、网络安全和咨询交付同时说明:Agent 正在进入高专业门槛行业。
- OpenAI 发布 Codex 角色插件、Sites 和 annotations,Codex 从编程工具扩展到多岗位工作流。
- Anthropic 扩大 Project Glasswing,将 Claude Mythos Preview 提供给约 150 个新组织。
- Holo3.1 展示本地 Computer Use Agent 路线,端侧执行环境继续升温。
- 智谱 GLM Coding Plan 团队版上线,国内编码 Agent 开始补企业订阅与权限管理。