2026-05-02 AI 动态
- 美国防部与 OpenAI、Google、NVIDIA 等 7 家公司达成涉密 AI 协议。
- Meta 收购 Assured Robot Intelligence,继续加码人形机器人智能。
- Apple Support 误打包 Claude.md,暴露 AI 编程与客服系统线索。
- 智谱复盘 GLM-5 推理异常,指出长上下文 Agent 的系统工程瓶颈。
- Google 宣布 Gemini 将替代车载 Google Assistant。
头条要闻
美国防部接入 7 家 AI 公司:涉密网络成为前沿模型的新战场
5 月 1 日,美国国防部宣布与 7 家 AI 公司达成协议,将相关 AI 能力部署到国防部 IL6 和 IL7 级涉密网络环境中。名单包括 SpaceX、OpenAI、Google、NVIDIA、Reflection、Microsoft 和 Amazon Web Services。美国防部称,这些能力将用于数据综合、态势感知和复杂作战环境中的决策支持。
这条新闻的重点不只是“军方采购 AI”。它说明前沿模型正在进入高敏感、强权限、强审计的国家安全工作流。与普通企业部署相比,涉密网络中的 AI 系统更依赖访问控制、用途边界、人工监督、日志和供应链审查。Anthropic 未出现在本轮名单中,也延续了近几个月围绕 AI 使用边界、自治武器和大规模监控的争议。
AP · IT之家 · Nextgov/FCW
模型发布与更新
GLM-5 Scaling Pain:长上下文 Coding Agent 的问题不只在模型
智谱 4 月 29 日发布技术博客《Scaling Pain:超大规模 Coding Agent 推理实践》,量子位 5 月 1 日跟进解读。智谱称,GLM-5 系列在高并发、长上下文 Coding Agent 场景中曾出现乱码、复读、生僻字等异常,但这些问题在标准推理环境中难以复现。团队进一步定位到推理链路中的底层状态管理问题,而不是模型能力本身下降。
关键问题包括两类:一是 PD 分离架构下,Abort、KV Cache 回收和 RDMA 写入之间存在时序竞态;二是 HiCache 加载与计算重叠时,部分缓存可能在未完全就绪前被读取。智谱称修复后,异常输出发生率从约万分之十几下降至万分之三以下;同时提出 LayerSplit,将每张 GPU 只保存部分层 KV Cache,在 90% Cache 命中率、40K-120K 请求长度条件下,使系统吞吐提升 10% 到 132%。
这件事的启发很直接:进入 Agent 场景后,模型质量不再只由权重决定。长上下文、高缓存复用、高并发和复杂调度会把推理基础设施本身变成模型质量的一部分。所谓“降智”,有时是模型问题,有时是系统状态和缓存一致性问题。
| 指标 | 数据 |
|---|---|
| 主题 | Scaling Pain:超大规模 Coding Agent 推理实践 |
| 涉及模型 | GLM-5 系列 |
| 异常类型 | 乱码、复读、生僻字 |
| 核心原因 | KV Cache 竞态、HiCache 加载时序缺失 |
| 修复效果 | 异常率从约万分之十几降至万分之三以下 |
| LayerSplit 收益 | 40K-120K 请求长度下吞吐提升 10%-132% |
Gemini 进入车载系统:Google Assistant 在车内开始让位
Google 4 月 30 日宣布,Gemini 将作为升级项进入搭载 Google built-in 的汽车,替代原有 Google Assistant。Google 称,该更新将同时面向新车和已有车辆推送,首先从美国英语用户开始。
Google 给出的使用场景包括自然语言导航、地图与实时路况问答、短信总结和回复、音乐控制、Gemini Live 车内对话,以及读取车辆用户手册来回答车型相关问题。例如,用户可以询问如何设置后备箱开启高度、如何准备自动洗车,或查询电动车电量和附近充电点。
车载 AI 的关键不是把聊天机器人搬到中控屏,而是把语音、地图、车辆状态、用户手册、娱乐和安全约束合并成一个低分心交互入口。Gemini 进入车载系统,也意味着大模型助手正在从手机和网页继续向车机、眼镜、电视等终端迁移。
| 指标 | 数据 |
|---|---|
| 产品 | Gemini for cars with Google built-in |
| 发布时间 | 2026-04-30 |
| 首批范围 | 美国英语用户 |
| 形态 | 替代车载 Google Assistant |
| 能力 | 自然语言交互、导航、消息、音乐、车辆手册问答、Gemini Live |
融资与交易
Meta 收购 Assured Robot Intelligence:人形机器人的“智能层”继续升温
TechCrunch 5 月 1 日报道,Meta 已收购人形机器人 AI 初创公司 Assured Robot Intelligence(ARI),交易金额未披露。ARI 团队及其联合创始人 Lerrel Pinto、Xiaolong Wang 将加入 Meta Superintelligence Labs。Meta 对 TechCrunch 表示,ARI 位于机器人智能前沿,目标是让机器人理解、预测并适应复杂动态环境中的人类行为。
ARI 的方向不是制造整机,而是为人形机器人构建基础模型、控制和自学习能力。Meta 过去一年已经多次释放人形机器人信号:如果它未来不直接做消费级人形机器人,也可能试图成为机器人智能、传感器和软件层的供应方。
这条收购与近期机器人仿真、世界模型、World Action Model 等动态相互呼应。具身智能正在从“硬件形态竞争”进入“机器人如何获得可泛化的控制能力”的阶段。
| 日期 | 参与方 | 金额 | 内容 |
|---|---|---|---|
| 2026-05-01 | Meta / Assured Robot Intelligence | 未披露 | ARI 团队加入 Meta Superintelligence Labs,增强人形机器人智能方向 |
Replit 回应 Cursor 与 SpaceX 传闻:AI 编程平台进入独立性考验
TechCrunch 5 月 1 日报道,Replit CEO Amjad Masad 在 StrictlyVC 活动中回应了 Cursor 与 SpaceX 600 亿美元交易传闻,并表示自己更倾向于不出售 Replit。报道称,Replit 过去 18 个月增长迅速,Masad 称公司年化收入 run rate 正朝 10 亿美元级别推进,净收入留存率最高可达 300%。
这条新闻本身不是新模型发布,但它反映出 AI 编程工具市场的商业压力:Cursor、Replit、Claude Code、OpenAI Codex、GitHub Copilot 正在争夺开发者工作入口,而算力、模型、分发渠道和企业采购都会影响这些工具能否独立发展。SpaceX / Cursor 的交易传闻也把 AI Coding 从 SaaS 工具推到了大型资本和基础设施组合中。
全球产业动态
Apple Support 误打包 Claude.md:AI 编程进入生产流程,也带来发布治理问题
5 月 2 日,量子位和 IT之家报道,Apple Support 应用 5 月 1 日推送的 v5.13 版本中意外包含 Claude.md 文件。报道称,该文件由 MacRumors 分析师 Aaron Perris 发现,事故发生后苹果已紧急撤回或更新。Claude.md 通常用于 Claude Code 项目级指令,记录项目结构、构建方式、规范和注意事项。
报道提到,泄露内容显示 Apple Support 聊天系统包含 AI 自动应答与真人客服接管的双后端设计,Juno AI 负责自动应答,Live Agents 负责真人客服接管,并通过协议层统一处理消息。需要注意的是,单个应用包中的文件不能直接证明苹果全公司都以相同方式使用 Claude,但它提供了一个少见窗口:大型科技公司内部也在把 AI 编程助手和 AI 客服系统放进真实产品工程链路。
这件事的重点不是“苹果也用 AI 写代码”,而是发布治理问题。Claude.md 是否应进入版本控制、是否应打包进生产产物、AI 生成或维护的工程文件如何被审核,都会成为 AI 编程工作流的基础规范。
灵境造物 × openJiuwen:科研多智能体从演示走向平台化
量子位 5 月 1 日报道,中国科学技术大学发布“灵境造物”智能科研云平台,并由华为支持的 openJiuwen 社区与 MindSpore 社区提供面向多智能体的 Coordination Engineering 技术体系。报道称,灵境造物面向材料化学、分子催化等场景,将科学大模型、垂类小模型、科研机器人、自动计算、自动实验和技能库进行整合。
openJiuwen 的重点不是单个 Agent,而是多智能体团队协作:Agent Team Engine 负责团队组建、任务拆解和协作执行;Team Skills 将协作经验封装为可复用能力;Team Skills Hub 提供共享平台;自演进机制则把执行轨迹中的角色缺位、流程断点和工具失效转为后续经验。
科研场景天然适合多智能体:文献调研、材料建模、性能筛选、实验设计、数据分析很难由单个 Agent 稳定覆盖。灵境造物这类平台如果能打通计算、实验和机器人执行,AI for Science 的瓶颈会从“能不能回答问题”转向“能不能闭环推进研究任务”。
关键数据一览
| 指标 | 数据 |
|---|---|
| 美国防部 AI 合作公司 | SpaceX、OpenAI、Google、NVIDIA、Reflection、Microsoft、AWS |
| 美国防部接入网络 | IL6 / IL7 涉密网络环境 |
| GenAI.mil 使用情况 | IT之家援引称上线 5 个月已有超 130 万名国防部人员使用 |
| GLM-5 异常类型 | 乱码、复读、生僻字 |
| GLM-5 异常修复效果 | 从约万分之十几降至万分之三以下 |
| LayerSplit 测试条件 | Cache 命中率 90%,请求长度 40K-120K |
| LayerSplit 吞吐提升 | 10%-132% |
| Apple Support 涉事版本 | v5.13 |
| Gemini 车载更新 | 首批面向美国英语用户,覆盖新车和已有车辆 |
| Meta / ARI 交易 | 金额未披露,团队加入 Meta Superintelligence Labs |
| Replit 商业指标 | CEO 称年化收入 run rate 朝 10 亿美元级别推进 |
Sources
- AP — US military reaches deals with 7 tech companies to use their AI on classified systems — 支撑美国防部与 7 家 AI 公司合作、Anthropic 缺席和军事 AI 背景。
- IT之家 — 美国防部与 OpenAI、谷歌、英伟达、微软等 7 家 AI 公司达成协议 — 支撑 IL6 / IL7、GenAI.mil 使用人数和中文报道信息。
- Nextgov/FCW — Pentagon makes agreements with 7 companies to add AI to classified networks — 支撑涉密网络、参与公司和国防 AI 场景。
- 智谱 / Z.ai — Scaling Pain:超大规模 Coding Agent 推理实践 — 支撑 GLM-5 推理异常、KV Cache 竞态、HiCache、LayerSplit 和吞吐数据。
- 量子位 — 智谱公布“降智”的秘密 — 支撑 GLM-5 Scaling Pain 的中文解读和关键指标。
- Google Blog — Your car with Google built-in is about to get smarter, thanks to Gemini — 支撑 Gemini 进入车载系统、功能和 rollout 信息。
- TechCrunch — Meta buys robotics startup to bolster its humanoid AI ambitions — 支撑 Meta 收购 ARI、团队归属和人形机器人方向。
- Business Insider — Meta bought some help in its quest for humanoid robots — 支撑 ARI 背景、创始人和 Meta 机器人战略。
- TechCrunch — Replit’s Amjad Masad on the Cursor deal — 支撑 Replit 对 Cursor / SpaceX 传闻的回应和商业指标。
- 量子位 — 苹果官方 App 误打包了 Claude.md — 支撑 Apple Support v5.13、Claude.md、Juno AI 和 AI / 真人客服双后端描述。
- IT之家 — 苹果官方 App 误打包了 Claude.md — 支撑中文报道、事件时间和 Apple Support 文件泄露信息。
- 量子位 — 华为携手中科大发布灵境造物 — 支撑灵境造物、openJiuwen、Coordination Engineering、Team Skills 和 MindSpore Science 信息。
本 Newsletter 基于公开信息整理,重点覆盖 2026 年 4 月 30 日至 2026 年 5 月 2 日期间新增、更新或集中发酵的 AI 动态;所有信息均来自公开来源,不构成投资建议。