跳到主要内容

2026-05-02 AI 动态

· 阅读需 12 分钟
本期焦点
  1. 美国防部与 OpenAI、Google、NVIDIA 等 7 家公司达成涉密 AI 协议。
  2. Meta 收购 Assured Robot Intelligence,继续加码人形机器人智能。
  3. Apple Support 误打包 Claude.md,暴露 AI 编程与客服系统线索。
  4. 智谱复盘 GLM-5 推理异常,指出长上下文 Agent 的系统工程瓶颈。
  5. Google 宣布 Gemini 将替代车载 Google Assistant。

头条要闻

美国防部接入 7 家 AI 公司:涉密网络成为前沿模型的新战场

5 月 1 日,美国国防部宣布与 7 家 AI 公司达成协议,将相关 AI 能力部署到国防部 IL6 和 IL7 级涉密网络环境中。名单包括 SpaceX、OpenAI、Google、NVIDIA、Reflection、Microsoft 和 Amazon Web Services。美国防部称,这些能力将用于数据综合、态势感知和复杂作战环境中的决策支持。

这条新闻的重点不只是“军方采购 AI”。它说明前沿模型正在进入高敏感、强权限、强审计的国家安全工作流。与普通企业部署相比,涉密网络中的 AI 系统更依赖访问控制、用途边界、人工监督、日志和供应链审查。Anthropic 未出现在本轮名单中,也延续了近几个月围绕 AI 使用边界、自治武器和大规模监控的争议。

AP · IT之家 · Nextgov/FCW


模型发布与更新

GLM-5 Scaling Pain:长上下文 Coding Agent 的问题不只在模型

智谱 4 月 29 日发布技术博客《Scaling Pain:超大规模 Coding Agent 推理实践》,量子位 5 月 1 日跟进解读。智谱称,GLM-5 系列在高并发、长上下文 Coding Agent 场景中曾出现乱码、复读、生僻字等异常,但这些问题在标准推理环境中难以复现。团队进一步定位到推理链路中的底层状态管理问题,而不是模型能力本身下降。

关键问题包括两类:一是 PD 分离架构下,Abort、KV Cache 回收和 RDMA 写入之间存在时序竞态;二是 HiCache 加载与计算重叠时,部分缓存可能在未完全就绪前被读取。智谱称修复后,异常输出发生率从约万分之十几下降至万分之三以下;同时提出 LayerSplit,将每张 GPU 只保存部分层 KV Cache,在 90% Cache 命中率、40K-120K 请求长度条件下,使系统吞吐提升 10% 到 132%。

这件事的启发很直接:进入 Agent 场景后,模型质量不再只由权重决定。长上下文、高缓存复用、高并发和复杂调度会把推理基础设施本身变成模型质量的一部分。所谓“降智”,有时是模型问题,有时是系统状态和缓存一致性问题。

指标数据
主题Scaling Pain:超大规模 Coding Agent 推理实践
涉及模型GLM-5 系列
异常类型乱码、复读、生僻字
核心原因KV Cache 竞态、HiCache 加载时序缺失
修复效果异常率从约万分之十几降至万分之三以下
LayerSplit 收益40K-120K 请求长度下吞吐提升 10%-132%

智谱 / Z.ai · 量子位


Gemini 进入车载系统:Google Assistant 在车内开始让位

Google 4 月 30 日宣布,Gemini 将作为升级项进入搭载 Google built-in 的汽车,替代原有 Google Assistant。Google 称,该更新将同时面向新车和已有车辆推送,首先从美国英语用户开始。

Google 给出的使用场景包括自然语言导航、地图与实时路况问答、短信总结和回复、音乐控制、Gemini Live 车内对话,以及读取车辆用户手册来回答车型相关问题。例如,用户可以询问如何设置后备箱开启高度、如何准备自动洗车,或查询电动车电量和附近充电点。

车载 AI 的关键不是把聊天机器人搬到中控屏,而是把语音、地图、车辆状态、用户手册、娱乐和安全约束合并成一个低分心交互入口。Gemini 进入车载系统,也意味着大模型助手正在从手机和网页继续向车机、眼镜、电视等终端迁移。

指标数据
产品Gemini for cars with Google built-in
发布时间2026-04-30
首批范围美国英语用户
形态替代车载 Google Assistant
能力自然语言交互、导航、消息、音乐、车辆手册问答、Gemini Live

Google Blog


融资与交易

Meta 收购 Assured Robot Intelligence:人形机器人的“智能层”继续升温

TechCrunch 5 月 1 日报道,Meta 已收购人形机器人 AI 初创公司 Assured Robot Intelligence(ARI),交易金额未披露。ARI 团队及其联合创始人 Lerrel Pinto、Xiaolong Wang 将加入 Meta Superintelligence Labs。Meta 对 TechCrunch 表示,ARI 位于机器人智能前沿,目标是让机器人理解、预测并适应复杂动态环境中的人类行为。

ARI 的方向不是制造整机,而是为人形机器人构建基础模型、控制和自学习能力。Meta 过去一年已经多次释放人形机器人信号:如果它未来不直接做消费级人形机器人,也可能试图成为机器人智能、传感器和软件层的供应方。

这条收购与近期机器人仿真、世界模型、World Action Model 等动态相互呼应。具身智能正在从“硬件形态竞争”进入“机器人如何获得可泛化的控制能力”的阶段。

日期参与方金额内容
2026-05-01Meta / Assured Robot Intelligence未披露ARI 团队加入 Meta Superintelligence Labs,增强人形机器人智能方向

TechCrunch · Business Insider


Replit 回应 Cursor 与 SpaceX 传闻:AI 编程平台进入独立性考验

TechCrunch 5 月 1 日报道,Replit CEO Amjad Masad 在 StrictlyVC 活动中回应了 Cursor 与 SpaceX 600 亿美元交易传闻,并表示自己更倾向于不出售 Replit。报道称,Replit 过去 18 个月增长迅速,Masad 称公司年化收入 run rate 正朝 10 亿美元级别推进,净收入留存率最高可达 300%。

这条新闻本身不是新模型发布,但它反映出 AI 编程工具市场的商业压力:Cursor、Replit、Claude Code、OpenAI Codex、GitHub Copilot 正在争夺开发者工作入口,而算力、模型、分发渠道和企业采购都会影响这些工具能否独立发展。SpaceX / Cursor 的交易传闻也把 AI Coding 从 SaaS 工具推到了大型资本和基础设施组合中。

TechCrunch


全球产业动态

Apple Support 误打包 Claude.md:AI 编程进入生产流程,也带来发布治理问题

5 月 2 日,量子位和 IT之家报道,Apple Support 应用 5 月 1 日推送的 v5.13 版本中意外包含 Claude.md 文件。报道称,该文件由 MacRumors 分析师 Aaron Perris 发现,事故发生后苹果已紧急撤回或更新。Claude.md 通常用于 Claude Code 项目级指令,记录项目结构、构建方式、规范和注意事项。

报道提到,泄露内容显示 Apple Support 聊天系统包含 AI 自动应答与真人客服接管的双后端设计,Juno AI 负责自动应答,Live Agents 负责真人客服接管,并通过协议层统一处理消息。需要注意的是,单个应用包中的文件不能直接证明苹果全公司都以相同方式使用 Claude,但它提供了一个少见窗口:大型科技公司内部也在把 AI 编程助手和 AI 客服系统放进真实产品工程链路。

这件事的重点不是“苹果也用 AI 写代码”,而是发布治理问题。Claude.md 是否应进入版本控制、是否应打包进生产产物、AI 生成或维护的工程文件如何被审核,都会成为 AI 编程工作流的基础规范。

量子位 · IT之家


灵境造物 × openJiuwen:科研多智能体从演示走向平台化

量子位 5 月 1 日报道,中国科学技术大学发布“灵境造物”智能科研云平台,并由华为支持的 openJiuwen 社区与 MindSpore 社区提供面向多智能体的 Coordination Engineering 技术体系。报道称,灵境造物面向材料化学、分子催化等场景,将科学大模型、垂类小模型、科研机器人、自动计算、自动实验和技能库进行整合。

openJiuwen 的重点不是单个 Agent,而是多智能体团队协作:Agent Team Engine 负责团队组建、任务拆解和协作执行;Team Skills 将协作经验封装为可复用能力;Team Skills Hub 提供共享平台;自演进机制则把执行轨迹中的角色缺位、流程断点和工具失效转为后续经验。

科研场景天然适合多智能体:文献调研、材料建模、性能筛选、实验设计、数据分析很难由单个 Agent 稳定覆盖。灵境造物这类平台如果能打通计算、实验和机器人执行,AI for Science 的瓶颈会从“能不能回答问题”转向“能不能闭环推进研究任务”。

量子位


关键数据一览

指标数据
美国防部 AI 合作公司SpaceX、OpenAI、Google、NVIDIA、Reflection、Microsoft、AWS
美国防部接入网络IL6 / IL7 涉密网络环境
GenAI.mil 使用情况IT之家援引称上线 5 个月已有超 130 万名国防部人员使用
GLM-5 异常类型乱码、复读、生僻字
GLM-5 异常修复效果从约万分之十几降至万分之三以下
LayerSplit 测试条件Cache 命中率 90%,请求长度 40K-120K
LayerSplit 吞吐提升10%-132%
Apple Support 涉事版本v5.13
Gemini 车载更新首批面向美国英语用户,覆盖新车和已有车辆
Meta / ARI 交易金额未披露,团队加入 Meta Superintelligence Labs
Replit 商业指标CEO 称年化收入 run rate 朝 10 亿美元级别推进

Sources


本 Newsletter 基于公开信息整理,重点覆盖 2026 年 4 月 30 日至 2026 年 5 月 2 日期间新增、更新或集中发酵的 AI 动态;所有信息均来自公开来源,不构成投资建议。