2026-04-27 AI 动态

2026年4月27日 · 阅读需 13 分钟

本期焦点

DeepSeek API 输入缓存命中价格降至原有 1/10，V4-Pro 叠加限时 2.5 折。
蚂蚁灵波开源 LingBot-World-Fast，灵光 App 上线移动端世界模型体验。
联影智能开源 uAI Nexus MedVLM 和 MedVidBench，医疗视频理解有了公共评测标尺。
小米称未来三年 AI 投入超 600 亿元，MiMo-V2.5 即将开源。
Anthropic 公开解释 Claude Code 质量波动，Agent 产品层可靠性成为显性议题。

头条要闻

DeepSeek-V4 价格战继续：缓存命中成本降至原有 1/10

4 月 26 日晚至 4 月 27 日，DeepSeek-V4 的产品主线从“百万上下文开源模型”快速转向“百万上下文能不能便宜地用起来”。IT之家报道，DeepSeek 全系 API 服务的输入缓存命中价格即日起降至原有价格的 1/10，DeepSeek-V4-Pro 还可在 5 月 5 日前叠加 2.5 折限时优惠。调价后，DeepSeek-V4-Pro 输入缓存命中价格为 0.025 元 / 百万 tokens，缓存未命中输入为 3 元 / 百万 tokens，输出为 6 元 / 百万 tokens；DeepSeek-V4-Flash 输入缓存命中价格为 0.02 元 / 百万 tokens，缓存未命中输入为 1 元 / 百万 tokens，输出为 2 元 / 百万 tokens。

这次降价对 Agent 工作流的影响比普通聊天更大。长程代码、RAG、浏览器自动化和多工具调用通常会反复携带系统提示、工具定义、代码上下文和历史轨迹，输入 token 占比远高于输出。量子位实测称，在 Agent 编程任务中，V4-Pro 输入缓存命中率约 95%，V4-Flash 约 91%；其一轮约 3500 万 tokens 的测试成本可从 31.73 元降到约 5.34 元，整体节省约 83%。Reuters 转述也把这次 V4-Pro 75% 折扣和全线输入缓存降价，放在中国 AI 价格竞争的语境里观察。

IT之家 · 量子位 · Reuters via Global Banking & Finance

模型发布与更新

LingBot-World-Fast：世界模型第一次进入普通手机体验

4 月 27 日，蚂蚁灵光 App 上线“体验世界模型”功能。用户上传一张图片，就可以在手机端生成最长 60 秒的 3D 世界，并用类似手游摇杆的方式以第一人称视角移动和观察。量子位称，这是世界模型首次以移动端产品形态面向普通用户开放。

支撑这一体验的是蚂蚁灵波开源的 LingBot-World-Fast。该模型在 480P 分辨率下可实现 16 fps 实时生成，端到端交互延迟控制在 1 秒以内；开发者也可以基于 Hugging Face 和 ModelScope 上开放的模型与代码本地部署。它的方向不是再生成一段离线视频，而是让用户进入一个可操作、可即时响应的环境。对具身智能来说，这类模型可以提供低成本虚拟训练场；对游戏和内容创作来说，它把“世界原型”从渲染管线里抽出来，变成可由图片和提示词驱动的交互对象。

指标	数据
模型	LingBot-World-Fast
发布 / 上线时间	2026-04-27
用户入口	灵光 App“体验世界模型”
输入	单张图片 / 自然语言指令
输出	最长 60 秒可交互 3D 世界
实时性能	480P，16 fps，端到端延迟 1 秒内
开源平台	Hugging Face、ModelScope

量子位 · 量子位

uAI Nexus MedVLM：医疗视频理解开源模型和榜单同步上线

4 月 26 日，量子位报道联影智能开源 uAI Nexus MedVLM（元智医疗视频理解大模型），并同步上线 MedVidBench 测试集和医疗视频理解榜单。该模型面向手术与护理视频理解，支持 4B / 7B 参数规模，单卡可部署；训练数据包含超过 53 万条视频-指令数据，整合 8 个专业医学数据集，覆盖内镜、腹腔镜、开放手术、机器人手术、护理操作等场景。论文已被 CVPR 2026 收录。

医疗视频和普通视觉理解的差异在于，它需要同时处理空间位置、时序动作、器械识别、解剖结构和临床规范。报道提到，团队同步发布了 6245 个视频-指令对构成的标准测试集，并开放动态排行榜。这个动作会让医疗视频理解从“各家各测各的”走向更可比较的基准体系。短期看，它更像临床教学、术后报告、手术质控和研究数据集；长期看，它也可能成为手术机器人、术中辅助和具身医疗系统的感知层基础。

指标	数据
模型	uAI Nexus MedVLM / 元智医疗视频理解大模型
参数规模	4B / 7B
训练数据	超 53 万条视频-指令数据
测试集	MedVidBench，6245 个视频-指令对
覆盖任务	视频摘要、关键安全视野评估、下一步操作预测、技能评估、时间动作定位、密集视频描述等
开放内容	Demo、推理代码、数据集、榜单、论文、项目页

量子位

Frontier SWE × OpenEnv：长程软件工程环境登上 Hugging Face

Hugging Face 社区 4 月 26 日发布 Frontier SWE × OpenEnv 文章，介绍将 4 个长程软件工程任务打包成 Hugging Face Spaces 上可运行的 Docker 化环境。这些任务包括 notebook 压缩、Postgres wire adapter、依赖类型检查器、libexpat 到 x86-64 汇编等，并提供统一的 Gym 风格 API、MCP 工具、分层奖励和离线训练管线。

这类工作补齐了 Coding Agent 评测里经常缺的一环：真实长程任务不是单次补丁，而是需要规划、执行、验证、提交子任务，并在 45-90 分钟甚至更长的回合里保持状态。它也说明开源社区正在把 Agent 训练环境、奖励函数、轨迹数据和可复现实验一起产品化。模型能力提高之后，谁能提供可重复、可度量、可训练的长程环境，谁就更接近下一轮 Agent 工程基础设施。

Hugging Face Blog

融资与交易

Google 与 Anthropic 的算力 / 资本绑定仍在影响市场定价

近 48 小时内，公开可核验的新增融资主线不算密集，但大模型资本市场仍被“算力绑定”主导。TechCrunch 4 月 24 日报道，Google 计划以现金和算力形式向 Anthropic 投入最高 400 亿美元，其中当前承诺 100 亿美元，另有 300 亿美元与 Anthropic 达成特定业绩目标相关。报道提到该交易对应 Anthropic 约 3500 亿美元估值口径。

这条信息虽然发生在 48 小时窗口边缘，但与本周 Claude Code 质量 postmortem、Mythos 受限测试、Google Cloud Next 的 Agent 平台化叙事放在一起看，资本正在押注的不只是一个模型版本，而是模型、云、TPU、企业客户和安全治理共同组成的供应链。

日期	参与方	金额 / 估值	内容
2026-04-24	Google / Anthropic	最高 400 亿美元现金和算力；报道估值约 3500 亿美元	支持 Anthropic 模型与算力扩张，部分资金与业绩目标挂钩

TechCrunch

全球产业动态

中国信通院启动 DeepSeek V4 国产化适配测试

4 月 27 日，中国信通院宣布联合人工智能软硬件协同创新与适配验证中心，正式启动 DeepSeek V4 国产化适配测试工作。测试依托工信部重点实验室，以及 AISHPerf 人工智能软硬件基准体系与测试工具，面向芯片、服务器、一体机、集群、开发框架与工具链、智算设施和平台等产品系统开展。

测试覆盖 DeepSeek V4 全系列模型，聚焦推理、微调等流程，并新增长序列处理、代码生成与理解、智能体调用成功率、任务拆解能力等方向。这个动作把“开源模型发布”推进到“国产软硬件能否同频迭代”的阶段。对于国内 AI 基础设施来说，1M 上下文、思考模式、工具调用和 Agent 评测会直接放大芯片、推理框架、KV cache、集群调度和开发工具链之间的适配压力。

IT之家

小米投资者日：MiMo-V2.5、Miclaw 与人车家 Agent 中枢

IT之家 4 月 27 日报道，在小米投资者日上，小米集团副总裁、技术委员会主席屈恒围绕“Agent 范式重塑小米与人车家全生态”分享 AI 战略。报道整理称，小米未来三年 AI 投入超过 600 亿元；MiMo-V2.5 即将开源，几乎适配国内所有芯片；小米将把 Agent 能力用于人车家生态和企业效率两条线。

产品路径上，小米把 MiMo、Miclaw、小爱、智能座舱、Miloco 和跨设备共享记忆放在同一张图里。这里的关键不是单个模型，而是端侧芯片、车、手机、平板、音箱、家庭设备和企业流程之间如何共享上下文、权限和记忆。硬件公司做 Agent 的优势在于入口多、传感器多、场景连续；难点也在这里：跨端调度、隐私边界和长期记忆管理会比纯软件 Agent 更复杂。

IT之家

Claude Code 质量波动 postmortem：Agent 产品层也会“降智”

Anthropic 4 月 23 日发布工程说明，量子位 4 月 26 日集中跟进。官方称，过去一个多月关于 Claude Code 质量下降的反馈，来自三个产品层问题：3 月 4 日将 Claude Code 默认 reasoning effort 从 high 调到 medium，3 月 26 日的缓存优化 bug 导致旧 thinking 在会话后续轮次中被反复清空，4 月 16 日加入的减少冗长输出系统提示伤害了编码质量。Anthropic 表示 API 和推理层未受影响，三个问题已在 4 月 20 日的 v2.1.116 中解决，并重置订阅用户使用额度。

这件事给 Agent 产品敲了一个很具体的钟：用户感知到的“模型聪不聪明”，不只由权重决定，还由 reasoning effort 默认值、系统提示、缓存策略、上下文保留、工具调用历史和 UI 暴露方式共同决定。未来 Coding Agent 的稳定性评估，应该同时看模型 benchmark 和产品层变更记录。

Anthropic Engineering · 量子位

关键数据一览

指标	数据
DeepSeek API 输入缓存命中降价	全系降至原有价格 1/10
DeepSeek-V4-Pro 限时优惠	5 月 5 日前叠加 2.5 折
V4-Pro 调价后价格	缓存命中输入 0.025 元 / 百万 tokens；未命中输入 3 元；输出 6 元
V4-Flash 调价后价格	缓存命中输入 0.02 元 / 百万 tokens；未命中输入 1 元；输出 2 元
量子位 Agent 编程实测	约 3500 万 tokens 成本从 31.73 元降至约 5.34 元，节省约 83%
LingBot-World-Fast	480P、16 fps、端到端延迟 1 秒内
灵光世界模型体验	单图生成最长 60 秒可交互 3D 世界
uAI Nexus MedVLM	4B / 7B 参数，超 53 万条视频-指令数据
MedVidBench	6245 个视频-指令对
小米 AI 投入	未来三年超过 600 亿元
MiMo-V2.5	即将开源，报道称几乎适配国内所有芯片
Claude Code 修复版本	2026-04-20，v2.1.116
Claude Code 受影响层	Claude Code、Claude Agent SDK、Claude Cowork；API 未受影响
Frontier SWE × OpenEnv	4 个长程 SWE 环境，支持 MCP 工具和分层奖励

Sources

IT之家 - 降至原有价格 1/10，DeepSeek API 输入缓存降价 - 支撑 DeepSeek API 输入缓存命中降价、V4-Pro / V4-Flash 调价后价格。
量子位 - DeepSeek V4 永久降价！缓存命中再打 1 折 - 支撑 DeepSeek 缓存命中率、Agent 编程成本实测和降价影响。
Reuters via Global Banking & Finance - China's DeepSeek slashes prices for new AI model - 支撑 DeepSeek V4-Pro 75% 折扣、全线输入缓存降价和国际媒体语境。
量子位 - 世界模型能实时玩了，蚂蚁灵波开源 LingBot-World-Fast - 支撑 LingBot-World-Fast 开源、实时性能和开发者开放信息。
量子位 - 灵光在手机端上线“体验世界模型”功能 - 支撑灵光 App 移动端世界模型体验、交互方式和用户入口。
量子位 - 全球首个医疗视频理解大模型开源 - 支撑 uAI Nexus MedVLM、MedVidBench、数据规模、任务覆盖和开源链接。
Hugging Face Blog - Building long-horizon SWE environments on Hugging Face - 支撑 Frontier SWE × OpenEnv 的长程软件工程环境、MCP 工具、奖励和训练管线。
TechCrunch - Google to invest up to $40B in Anthropic - 支撑 Google / Anthropic 资本与算力绑定信息。
IT之家 - 中国信通院正式启动 DeepSeek V4 国产化适配测试工作 - 支撑 DeepSeek V4 国产化适配测试范围、评测维度和 AISHPerf 信息。
IT之家 - 未来三年小米 AI 投入超 600 亿元 - 支撑小米 AI 投入、MiMo-V2.5、Miclaw、人车家 Agent 和企业效率规划。
Anthropic Engineering - An update on recent Claude Code quality reports - 支撑 Claude Code 质量问题的官方原因、时间线、修复版本和使用额度重置。
量子位 - Claude 终于认了！降智坐实，3 个 bug 全曝光 - 支撑中文社区对 Claude Code postmortem 的集中跟进与影响解读。

本 Newsletter 基于公开信息整理，重点覆盖 2026 年 4 月 25 日至 2026 年 4 月 27 日期间新增、更新或集中发酵的 AI 动态；所有信息均来自公开来源，不构成投资建议。

头条要闻​

DeepSeek-V4 价格战继续：缓存命中成本降至原有 1/10​

模型发布与更新​

LingBot-World-Fast：世界模型第一次进入普通手机体验​

uAI Nexus MedVLM：医疗视频理解开源模型和榜单同步上线​

Frontier SWE × OpenEnv：长程软件工程环境登上 Hugging Face​

融资与交易​

Google 与 Anthropic 的算力 / 资本绑定仍在影响市场定价​

全球产业动态​

中国信通院启动 DeepSeek V4 国产化适配测试​

小米投资者日：MiMo-V2.5、Miclaw 与人车家 Agent 中枢​

Claude Code 质量波动 postmortem：Agent 产品层也会“降智”​

关键数据一览​

Sources​