2026-04-17 AI 动态
- OpenAI 将 Codex 扩展到桌面、浏览器、图像和自动化工作流。
- Anthropic 发布 Claude Opus 4.7,强化长程编码和高分辨率视觉。
- 群核科技港股上市首日大涨,空间智能商业化进入资本市场视野。
- 具身智能数据基础设施继续升温,觅蜂、京东云、蚂蚁灵波集中发布。
- Agent 沙箱、企业治理和物理世界数据成为中英文资讯共同主线。
📰 头条要闻
OpenAI Codex 大更新:从代码助手走向“开发工作空间里的操作型 Agent”
OpenAI 4 月 16 日发布 Codex 重大更新,官方称目前每周已有超过 300 万开发者使用 Codex。新版本的重点不只是继续写代码,而是把 Codex 放进更完整的软件开发生命周期:它可以在 Mac 上以自己的光标操作桌面应用,多个 agent 可并行在后台工作;Codex App 也加入应用内浏览器、GitHub review comment 处理、多终端标签、远程 devbox SSH、文件预览、summary pane、图像生成与迭代能力,并新增 90 多个插件,覆盖 Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、Neon、Render 等工具。
这条新闻的产业含义很直接:Coding Agent 正在从“模型调用 IDE 或终端”升级为“能跨桌面、浏览器、云开发环境和协作工具执行任务的工作空间”。Codex 还扩展了自动化能力,允许复用已有会话线程、保留上下文,并让任务跨天或跨周继续推进;记忆和上下文感知建议则会先向 Enterprise、Edu、EU 和 UK 用户逐步推出。和 4 月 15 日的 Agents SDK 更新放在一起看,OpenAI 正在把 agent 的执行环境、记忆、工具连接、任务编排和用户界面一起产品化。
Claude Opus 4.7 发布:Anthropic 把长程编码、视觉和安全分层放在同一条产品线上
Anthropic 4 月 16 日宣布 Claude Opus 4.7 全面可用。官方称,Opus 4.7 相比 Opus 4.6 在高级软件工程、复杂长任务、指令遵循和自我验证方面有明显提升,同时强化了高分辨率视觉能力,支持最长边 2576 像素、约 375 万像素的图片输入。模型已在 Claude 产品、API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 上线,API 模型名为 claude-opus-4-7,价格保持为每百万输入 token 5 美元、每百万输出 token 25 美元。
值得注意的是,Anthropic 把 Opus 4.7 放在 Claude Mythos Preview 之下,并明确说明 Mythos 仍限制发布,Opus 4.7 会先测试新的网络安全防护策略。同步更新还包括新的 xhigh effort 档位、API task budgets 公测、Claude Code /ultrareview 专用审查会话,以及面向 Max 用户的 auto mode。IT之家在 4 月 16 日的中文报道中也跟进了 Opus 4.7 与 AI 设计工具传闻、Anthropic 高估值意向和企业客户增长数据,说明 Claude 生态正在同时拉动模型能力、开发者工具、设计工具和资本市场预期。
🚀 模型与产品更新
PPHermes:国内云端沙箱把开源 Hermes Agent 部署门槛降到十分钟
量子位 4 月 16 日报道,PPIO 发布 PPHermes,这是面向国内用户的 Hermes Agent 云端沙箱部署方案。Hermes Agent 来自 Nous Research,是一个开源自进化 AI Agent,核心能力包括从交互中自动创建和改进技能、跨会话记住用户偏好、调度定时任务、并行子 Agent 工作流等。
PPHermes 的关键是把 agent 从“本地脚本或海外云平台”搬到按需唤醒的国内云端沙箱。报道提到,PPHermes 提供面向 Hermes 的 CLI 工具链,支持启动、暂停和恢复;内置飞书集成;Claude Code、Cursor 等 AI 编程工具可用自然语言管理沙箱;计费采用 pause/resume 机制,暂停即停止计费。它和 OpenAI Codex、Agents SDK 的共同方向是:Agent 真正落地时,沙箱、状态、权限、成本和工作流恢复能力会成为基础设施,而不是附加功能。
| 指标 | 数据 |
|---|---|
| 发布时间 | 2026-04-16 |
| 产品 | PPHermes |
| 底层 Agent | Nous Research Hermes Agent |
| 核心形态 | 国内云端沙箱部署方案 |
| 主要能力 | 一键部署、pause/resume、飞书集成、AI 编程工具自然语言管理 |
LingBot-Map:流式 3D 重建把具身视觉推向实时世界建模
量子位 4 月 16 日报道,蚂蚁灵波开源 LingBot-Map,定位为纯自回归流式 3D 重建基础模型。它面向机器人、扫地机、自动驾驶等需要实时感知的场景,目标是在无限长视频流中“来一帧算一帧”,边看边重建三维世界,而不是先存完整视频再离线建模。
报道提到,LingBot-Map 的核心机制是 Geometric Context Attention,通过锚点、位姿参考窗口和轨迹记忆管理长期空间信息。历史帧被压缩为极少量 token,单帧信息增长量相较传统因果注意力降低 80 倍,从而在处理万帧长视频时保持近似恒定显存消耗。对具身智能来说,这类能力的价值不在“生成好看的 3D 画面”,而在为机器人持续定位、路径理解、物体关系和实时决策提供可用的空间状态。
| 指标 | 数据 |
|---|---|
| 发布时间 | 2026-04-16 |
| 项目 | LingBot-Map |
| 方向 | 流式 3D 重建 / 具身视觉 |
| 技术重点 | Geometric Context Attention、锚点、位姿参考窗口、轨迹记忆 |
| 关键数据 | 报道称单帧信息增长量降低 80 倍 |
Hugging Face 社区:OCR、Agent 失败模式、多模态检索和 TTS 继续活跃
Hugging Face Blog 近几日的社区文章显示,英文开源生态仍围绕“把模型能力接入真实工作流”展开。4 月 16 日的新文章包括面向 MLX / LLM 的工程文章,以及使用 Sentence Transformers 训练和微调多模态 embedding 与 reranker 的教程;4 月 15 日有 VAKRA Agent 推理、工具使用和失败模式分析,以及 HCompany 的 AI browser companion HoloTab。近 48 小时内还出现了 easyaligner 这类音频对齐工具和 Darwin-TTS 相关讨论。
这些信号虽然不是单一大厂发布,但能反映开发者侧的实际需求:OCR、浏览器伴侣、Agent 失败分析、多模态检索、TTS 和前端工作流正在成为开源社区反复打磨的高频能力。它们也补足了官方发布之外的生态观察:Agent 能力要进入生产,不只依赖大模型本身,还依赖数据清洗、文档解析、评测、对齐、检索和音视频处理工具链。
💰 融资与交易
群核科技港股上市:空间智能第一股首日开盘大涨
量子位 4 月 17 日报道,群核科技在港股正式挂牌上市,报 20.70 港元,较发行价上涨 171.65%,成为“杭州六小龙”中率先冲线的一家公司。报道把群核定位为空间智能商业化代表,其 2025 年营收 8.20 亿元,经调整净利润转正至 5712.7 万元,毛利率 82.2%。
空间智能的意义在于把物理世界转化为可计算、可编辑、可复用的三维结构,而不是只生成像素级视频。群核过去以酷家乐等业务沉淀三维空间数据,报道提到其积累超过 5 亿个 3D 场景、4.8 亿个 3D 模型及空间设计元素,并推出 SpatialLM、SpatialGen 等空间模型。对 AI 产业来说,这次上市给了一个明确市场信号:世界模型、具身智能和 3D 空间数据不只是研究叙事,也开始以可验证收入和资本市场事件呈现。
| 日期 | 参与方 | 金额 | 内容 |
|---|---|---|---|
| 2026-04-17 | 群核科技 | 港股上市,首日开盘较发行价上涨 171.65% | 空间智能商业化公司登陆资本市场 |
| 2025 年 | 群核科技 | 营收 8.20 亿元 | 经调整净利润 5712.7 万元,毛利率 82.2% |
Anthropic 估值预期继续升温:模型发布、企业收入和设计工具传闻共振
IT之家 4 月 16 日援引外媒报道称,Anthropic 计划本周发布 Claude Opus 4.7 和 AI 设计工具,消息公布后 Adobe、Wix 和 Figma 股价均下跌超过 2%。报道还称,Anthropic 近期收到多家风投机构投资意向,估值最高达 8000 亿美元;其年化收入从 2025 年底的 90 亿美元增至 300 亿美元,年消费超过 100 万美元的企业客户突破 1000 家。
这些数字仍需以 Anthropic 官方融资公告为准,但它们说明资本市场正在把 Claude 视为“模型 + 开发者工具 + 企业工作流 + 设计生产力”的组合资产,而不只是聊天机器人。和 OpenAI Codex 的更新放在同一天看,AI 开发工具、AI 设计工具和企业 agent 的边界正在快速合并。
| 日期 | 参与方 | 金额 | 内容 |
|---|---|---|---|
| 2026-04-16 | Anthropic / 潜在投资者 | 传最高估值 8000 亿美元 | 多家风投表达投资意向,官方未确认 |
| 2026-04-16 | Anthropic | 年化收入传 300 亿美元 | 企业客户需求增长,年消费超 100 万美元客户传超 1000 家 |
🌍 全球产业动态
觅蜂科技发布物理 AI 数据平台:具身智能竞争转向“数据产能”
量子位 4 月 16 日报道,觅蜂科技成立 72 天后发布 MEgo 系列无本体数据采集硬件、物理 AI 数据服务平台和 MEgo Engine 数据治理引擎,并与京东云、百度云、阿里云等企业达成战略合作。报道强调,当前物理 AI 真机交互数据量不足大语言模型的两万分之一,具身智能数据存在标准缺失、质量参差和供需错配问题。
MEgo Gripper 是 480g 轻量化多模态数据采集夹爪,支持毫米级轨迹重建和亚毫秒级全局时间同步;MEgo View 提供 300° 全景感知和腕部交互特写双视角采集。觅蜂称 2026 年将实现千万小时级数据产能,并联合机构和企业发起“蜂巢数据共创行动”,目标到 2030 年达到百亿小时级数据产能。这条消息说明,具身智能的瓶颈正在从“有没有机器人 Demo”转向“有没有标准化、可规模化、可交易的物理交互数据”。
京东发布具身数据全链路基础设施:供应链公司开始进入机器人数据层
量子位 4 月 16 日报道,京东发布具身数据全链路基础设施,定位为打造“具身智能超级供应链”。这类基础设施的核心不是单点模型或单台机器人,而是把真实场景、采集设备、数据治理、仿真、训练、评测和商业交付串成闭环。
这条动态和觅蜂科技、LingBot-Map、群核科技上市形成同一条产业线索:物理世界数据正在成为 AI 新一轮基础设施。过去两年,行业主要争夺文本、代码、图像和视频数据;现在具身智能需要的是高质量动作轨迹、触觉、深度、IMU、多视角视频、三维空间结构和任务结果。供应链公司、云厂商、机器人公司和空间智能公司都会进入这层竞争。
arXiv 当前列表:Agent 评测、长期记忆、反谄媚与多智能体安全仍是研究高频主题
arXiv cs.AI 4 月当前列表显示已累计 2794 条记录。前列主题继续集中在 LLM / Agent 行为机制、多智能体临床预测、工具使用型 AI Agent 社区框架、agentic interaction 轨迹采样、LLM 系统决策中心设计、可靠不确定性估计、统一多模态模型安全基准、agentic coding benchmark 性能预测、个人电脑上下文 agent 评测等方向。
这些论文信号和产业新闻高度一致:Agent 已经从产品功能进入评测、安全、记忆、工具错误、长期一致性和用户上下文治理层面。对于企业应用,真正关键的不是某个模型在单轮问答里多强,而是它在长任务中能否可预测、可验证、可控、可审计。
📊 关键数据一览
| 指标 | 数据 |
|---|---|
| Codex 周活开发者 | OpenAI 称超过 300 万 |
| Codex 新增插件 | 超过 90 个 |
| Codex 桌面操作 | 初期面向 macOS,向 Codex desktop app 用户推出 |
| Claude Opus 4.7 API 价格 | 输入 5 美元 / 百万 token,输出 25 美元 / 百万 token |
| Claude Opus 4.7 高分辨率视觉 | 最长边 2576 像素,约 375 万像素 |
| 群核科技上市首日开盘涨幅 | 较发行价上涨 171.65% |
| 群核科技 2025 年营收 | 8.20 亿元 |
| 群核科技 2025 年毛利率 | 82.2% |
| 群核科技空间数据资产 | 报道称超过 5 亿个 3D 场景、4.8 亿个 3D 模型及空间设计元素 |
| 觅蜂 MEgo Gripper | 480g,多模态数据采集夹爪 |
| 觅蜂 2026 年数据产能目标 | 千万小时级 |
| 觅蜂 2030 年生态目标 | 百亿小时级数据产能 |
| LingBot-Map 记忆压缩 | 报道称单帧信息增长量降低 80 倍 |
| arXiv cs.AI 4 月当前列表 | 2794 条记录 |
📎 Sources
- OpenAI — Codex for (almost) everything — Codex 桌面操作、浏览器、图像、插件、自动化、记忆和可用性更新。
- The Verge — OpenAI's big Codex update is a direct shot at Claude Code — Codex 更新的第三方报道和竞争背景。
- Anthropic — Introducing Claude Opus 4.7 — Opus 4.7 发布、能力、价格、可用平台、安全分层和 Claude Code 更新。
- IT之家 — 曝 Anthropic 本周上线 Claude Opus 4.7 和 AI 设计工具 — 中文媒体对 Opus 4.7、AI 设计工具传闻、估值和收入数据的跟进。
- IT之家 — 消息称风投争相投资 Anthropic — Anthropic 潜在估值意向和融资背景。
- 量子位 — PPIO 上线 PPHermes — Hermes Agent 国内云端沙箱部署方案。
- 量子位 — 空间智能第一股群核科技上市 — 群核科技上市、空间智能定位、收入和数据资产。
- 量子位 — 觅蜂科技物理 AI 数据服务平台 — MEgo 硬件、物理 AI 数据平台、数据产能和生态合作。
- 量子位 — LingBot-Map 流式 3D 重建 — 蚂蚁灵波流式 3D 重建模型、GCA 机制和显存效率。
- 量子位 — 京东发布具身数据全链路基础设施 — 京东具身智能超级供应链和数据基础设施方向。
- Hugging Face Blog — 近 48 小时开源社区中 OCR、Agent、浏览器伴侣、多模态检索和 TTS 文章列表。
- arXiv cs.AI current — 4 月 AI 论文列表和 Agent / 安全 / 评测主题。
- arXiv cs.CL current — 4 月 NLP / LLM 论文列表。
本 Newsletter 由 AI 行业公开信息整理,数据截至 2026 年 4 月 17 日。所有信息均来自公开来源,不构成投资建议。