2026-05-02 AI 动态

2026年5月2日 · 阅读需 12 分钟

本期焦点

美国防部与 OpenAI、Google、NVIDIA 等 7 家公司达成涉密 AI 协议。
Meta 收购 Assured Robot Intelligence，继续加码人形机器人智能。
Apple Support 误打包 Claude.md，暴露 AI 编程与客服系统线索。
智谱复盘 GLM-5 推理异常，指出长上下文 Agent 的系统工程瓶颈。
Google 宣布 Gemini 将替代车载 Google Assistant。

头条要闻

美国防部接入 7 家 AI 公司：涉密网络成为前沿模型的新战场

5 月 1 日，美国国防部宣布与 7 家 AI 公司达成协议，将相关 AI 能力部署到国防部 IL6 和 IL7 级涉密网络环境中。名单包括 SpaceX、OpenAI、Google、NVIDIA、Reflection、Microsoft 和 Amazon Web Services。美国防部称，这些能力将用于数据综合、态势感知和复杂作战环境中的决策支持。

这条新闻的重点不只是“军方采购 AI”。它说明前沿模型正在进入高敏感、强权限、强审计的国家安全工作流。与普通企业部署相比，涉密网络中的 AI 系统更依赖访问控制、用途边界、人工监督、日志和供应链审查。Anthropic 未出现在本轮名单中，也延续了近几个月围绕 AI 使用边界、自治武器和大规模监控的争议。

AP · IT之家 · Nextgov/FCW

模型发布与更新

GLM-5 Scaling Pain：长上下文 Coding Agent 的问题不只在模型

智谱 4 月 29 日发布技术博客《Scaling Pain：超大规模 Coding Agent 推理实践》，量子位 5 月 1 日跟进解读。智谱称，GLM-5 系列在高并发、长上下文 Coding Agent 场景中曾出现乱码、复读、生僻字等异常，但这些问题在标准推理环境中难以复现。团队进一步定位到推理链路中的底层状态管理问题，而不是模型能力本身下降。

关键问题包括两类：一是 PD 分离架构下，Abort、KV Cache 回收和 RDMA 写入之间存在时序竞态；二是 HiCache 加载与计算重叠时，部分缓存可能在未完全就绪前被读取。智谱称修复后，异常输出发生率从约万分之十几下降至万分之三以下；同时提出 LayerSplit，将每张 GPU 只保存部分层 KV Cache，在 90% Cache 命中率、40K-120K 请求长度条件下，使系统吞吐提升 10% 到 132%。

这件事的启发很直接：进入 Agent 场景后，模型质量不再只由权重决定。长上下文、高缓存复用、高并发和复杂调度会把推理基础设施本身变成模型质量的一部分。所谓“降智”，有时是模型问题，有时是系统状态和缓存一致性问题。

指标	数据
主题	Scaling Pain：超大规模 Coding Agent 推理实践
涉及模型	GLM-5 系列
异常类型	乱码、复读、生僻字
核心原因	KV Cache 竞态、HiCache 加载时序缺失
修复效果	异常率从约万分之十几降至万分之三以下
LayerSplit 收益	40K-120K 请求长度下吞吐提升 10%-132%

智谱 / Z.ai · 量子位

Gemini 进入车载系统：Google Assistant 在车内开始让位

Google 4 月 30 日宣布，Gemini 将作为升级项进入搭载 Google built-in 的汽车，替代原有 Google Assistant。Google 称，该更新将同时面向新车和已有车辆推送，首先从美国英语用户开始。

Google 给出的使用场景包括自然语言导航、地图与实时路况问答、短信总结和回复、音乐控制、Gemini Live 车内对话，以及读取车辆用户手册来回答车型相关问题。例如，用户可以询问如何设置后备箱开启高度、如何准备自动洗车，或查询电动车电量和附近充电点。

车载 AI 的关键不是把聊天机器人搬到中控屏，而是把语音、地图、车辆状态、用户手册、娱乐和安全约束合并成一个低分心交互入口。Gemini 进入车载系统，也意味着大模型助手正在从手机和网页继续向车机、眼镜、电视等终端迁移。

指标	数据
产品	Gemini for cars with Google built-in
发布时间	2026-04-30
首批范围	美国英语用户
形态	替代车载 Google Assistant
能力	自然语言交互、导航、消息、音乐、车辆手册问答、Gemini Live

Google Blog

融资与交易

Meta 收购 Assured Robot Intelligence：人形机器人的“智能层”继续升温

TechCrunch 5 月 1 日报道，Meta 已收购人形机器人 AI 初创公司 Assured Robot Intelligence（ARI），交易金额未披露。ARI 团队及其联合创始人 Lerrel Pinto、Xiaolong Wang 将加入 Meta Superintelligence Labs。Meta 对 TechCrunch 表示，ARI 位于机器人智能前沿，目标是让机器人理解、预测并适应复杂动态环境中的人类行为。

ARI 的方向不是制造整机，而是为人形机器人构建基础模型、控制和自学习能力。Meta 过去一年已经多次释放人形机器人信号：如果它未来不直接做消费级人形机器人，也可能试图成为机器人智能、传感器和软件层的供应方。

这条收购与近期机器人仿真、世界模型、World Action Model 等动态相互呼应。具身智能正在从“硬件形态竞争”进入“机器人如何获得可泛化的控制能力”的阶段。

日期	参与方	金额	内容
2026-05-01	Meta / Assured Robot Intelligence	未披露	ARI 团队加入 Meta Superintelligence Labs，增强人形机器人智能方向

TechCrunch · Business Insider

Replit 回应 Cursor 与 SpaceX 传闻：AI 编程平台进入独立性考验

TechCrunch 5 月 1 日报道，Replit CEO Amjad Masad 在 StrictlyVC 活动中回应了 Cursor 与 SpaceX 600 亿美元交易传闻，并表示自己更倾向于不出售 Replit。报道称，Replit 过去 18 个月增长迅速，Masad 称公司年化收入 run rate 正朝 10 亿美元级别推进，净收入留存率最高可达 300%。

这条新闻本身不是新模型发布，但它反映出 AI 编程工具市场的商业压力：Cursor、Replit、Claude Code、OpenAI Codex、GitHub Copilot 正在争夺开发者工作入口，而算力、模型、分发渠道和企业采购都会影响这些工具能否独立发展。SpaceX / Cursor 的交易传闻也把 AI Coding 从 SaaS 工具推到了大型资本和基础设施组合中。

TechCrunch

全球产业动态

Apple Support 误打包 Claude.md：AI 编程进入生产流程，也带来发布治理问题

5 月 2 日，量子位和 IT之家报道，Apple Support 应用 5 月 1 日推送的 v5.13 版本中意外包含 Claude.md 文件。报道称，该文件由 MacRumors 分析师 Aaron Perris 发现，事故发生后苹果已紧急撤回或更新。Claude.md 通常用于 Claude Code 项目级指令，记录项目结构、构建方式、规范和注意事项。

报道提到，泄露内容显示 Apple Support 聊天系统包含 AI 自动应答与真人客服接管的双后端设计，Juno AI 负责自动应答，Live Agents 负责真人客服接管，并通过协议层统一处理消息。需要注意的是，单个应用包中的文件不能直接证明苹果全公司都以相同方式使用 Claude，但它提供了一个少见窗口：大型科技公司内部也在把 AI 编程助手和 AI 客服系统放进真实产品工程链路。

这件事的重点不是“苹果也用 AI 写代码”，而是发布治理问题。Claude.md 是否应进入版本控制、是否应打包进生产产物、AI 生成或维护的工程文件如何被审核，都会成为 AI 编程工作流的基础规范。

量子位 · IT之家

灵境造物 × openJiuwen：科研多智能体从演示走向平台化

量子位 5 月 1 日报道，中国科学技术大学发布“灵境造物”智能科研云平台，并由华为支持的 openJiuwen 社区与 MindSpore 社区提供面向多智能体的 Coordination Engineering 技术体系。报道称，灵境造物面向材料化学、分子催化等场景，将科学大模型、垂类小模型、科研机器人、自动计算、自动实验和技能库进行整合。

openJiuwen 的重点不是单个 Agent，而是多智能体团队协作：Agent Team Engine 负责团队组建、任务拆解和协作执行；Team Skills 将协作经验封装为可复用能力；Team Skills Hub 提供共享平台；自演进机制则把执行轨迹中的角色缺位、流程断点和工具失效转为后续经验。

科研场景天然适合多智能体：文献调研、材料建模、性能筛选、实验设计、数据分析很难由单个 Agent 稳定覆盖。灵境造物这类平台如果能打通计算、实验和机器人执行，AI for Science 的瓶颈会从“能不能回答问题”转向“能不能闭环推进研究任务”。

量子位

关键数据一览

指标	数据
美国防部 AI 合作公司	SpaceX、OpenAI、Google、NVIDIA、Reflection、Microsoft、AWS
美国防部接入网络	IL6 / IL7 涉密网络环境
GenAI.mil 使用情况	IT之家援引称上线 5 个月已有超 130 万名国防部人员使用
GLM-5 异常类型	乱码、复读、生僻字
GLM-5 异常修复效果	从约万分之十几降至万分之三以下
LayerSplit 测试条件	Cache 命中率 90%，请求长度 40K-120K
LayerSplit 吞吐提升	10%-132%
Apple Support 涉事版本	v5.13
Gemini 车载更新	首批面向美国英语用户，覆盖新车和已有车辆
Meta / ARI 交易	金额未披露，团队加入 Meta Superintelligence Labs
Replit 商业指标	CEO 称年化收入 run rate 朝 10 亿美元级别推进

Sources

AP — US military reaches deals with 7 tech companies to use their AI on classified systems — 支撑美国防部与 7 家 AI 公司合作、Anthropic 缺席和军事 AI 背景。
IT之家 — 美国防部与 OpenAI、谷歌、英伟达、微软等 7 家 AI 公司达成协议 — 支撑 IL6 / IL7、GenAI.mil 使用人数和中文报道信息。
Nextgov/FCW — Pentagon makes agreements with 7 companies to add AI to classified networks — 支撑涉密网络、参与公司和国防 AI 场景。
智谱 / Z.ai — Scaling Pain：超大规模 Coding Agent 推理实践 — 支撑 GLM-5 推理异常、KV Cache 竞态、HiCache、LayerSplit 和吞吐数据。
量子位 — 智谱公布“降智”的秘密 — 支撑 GLM-5 Scaling Pain 的中文解读和关键指标。
Google Blog — Your car with Google built-in is about to get smarter, thanks to Gemini — 支撑 Gemini 进入车载系统、功能和 rollout 信息。
TechCrunch — Meta buys robotics startup to bolster its humanoid AI ambitions — 支撑 Meta 收购 ARI、团队归属和人形机器人方向。
Business Insider — Meta bought some help in its quest for humanoid robots — 支撑 ARI 背景、创始人和 Meta 机器人战略。
TechCrunch — Replit’s Amjad Masad on the Cursor deal — 支撑 Replit 对 Cursor / SpaceX 传闻的回应和商业指标。
量子位 — 苹果官方 App 误打包了 Claude.md — 支撑 Apple Support v5.13、Claude.md、Juno AI 和 AI / 真人客服双后端描述。
IT之家 — 苹果官方 App 误打包了 Claude.md — 支撑中文报道、事件时间和 Apple Support 文件泄露信息。
量子位 — 华为携手中科大发布灵境造物 — 支撑灵境造物、openJiuwen、Coordination Engineering、Team Skills 和 MindSpore Science 信息。

本 Newsletter 基于公开信息整理，重点覆盖 2026 年 4 月 30 日至 2026 年 5 月 2 日期间新增、更新或集中发酵的 AI 动态；所有信息均来自公开来源，不构成投资建议。

头条要闻​

美国防部接入 7 家 AI 公司：涉密网络成为前沿模型的新战场​

模型发布与更新​

GLM-5 Scaling Pain：长上下文 Coding Agent 的问题不只在模型​

Gemini 进入车载系统：Google Assistant 在车内开始让位​

融资与交易​

Meta 收购 Assured Robot Intelligence：人形机器人的“智能层”继续升温​

Replit 回应 Cursor 与 SpaceX 传闻：AI 编程平台进入独立性考验​

全球产业动态​

Apple Support 误打包 Claude.md：AI 编程进入生产流程，也带来发布治理问题​

灵境造物 × openJiuwen：科研多智能体从演示走向平台化​

关键数据一览​

Sources​