2026-04-27 AI 动态
- DeepSeek API 输入缓存命中价格降至原有 1/10,V4-Pro 叠加限时 2.5 折。
- 蚂蚁灵波开源 LingBot-World-Fast,灵光 App 上线移动端世界模型体验。
- 联影智能开源 uAI Nexus MedVLM 和 MedVidBench,医疗视频理解有了公共评测标尺。
- 小米称未来三年 AI 投入超 600 亿元,MiMo-V2.5 即将开源。
- Anthropic 公开解释 Claude Code 质量波动,Agent 产品层可靠性成为显性议题。
头条要闻
DeepSeek-V4 价格战继续:缓存命中成本降至原有 1/10
4 月 26 日晚至 4 月 27 日,DeepSeek-V4 的产品主线从“百万上下文开源模型”快速转向“百万上下文能不能便宜地用起来”。IT之家报道,DeepSeek 全系 API 服务的输入缓存命中价格即日起降至原有价格的 1/10,DeepSeek-V4-Pro 还可在 5 月 5 日前叠加 2.5 折限时优惠。调价后,DeepSeek-V4-Pro 输入缓存命中价格为 0.025 元 / 百万 tokens,缓存未命中输入为 3 元 / 百万 tokens,输出为 6 元 / 百万 tokens;DeepSeek-V4-Flash 输入缓存命中价格为 0.02 元 / 百万 tokens,缓存未命中输入为 1 元 / 百万 tokens,输出为 2 元 / 百万 tokens。
这次降价对 Agent 工作流的影响比普通聊天更大。长程代码、RAG、浏览器自动化和多工具调用通常会反复携带系统提示、工具定义、代码上下文和历史轨迹,输入 token 占比远高于输出。量子位实测称,在 Agent 编程任务中,V4-Pro 输入缓存命中率约 95%,V4-Flash 约 91%;其一轮约 3500 万 tokens 的测试成本可从 31.73 元降到约 5.34 元,整体节省约 83%。Reuters 转述也把这次 V4-Pro 75% 折扣和全线输入缓存降价,放在中国 AI 价格竞争的语境里观察。
IT之家 · 量子位 · Reuters via Global Banking & Finance
模型发布与更新
LingBot-World-Fast:世界模型第一次进入普通手机体验
4 月 27 日,蚂蚁灵光 App 上线“体验世界模型”功能。用户上传一张图片,就可以在手机端生成最长 60 秒的 3D 世界,并用类似手游摇杆的方式以第一人称视角移动和观察。量子位称,这是世界模型首次以移动端产品形态面向普通用户开放。
支撑这一体验的是蚂蚁灵波开源的 LingBot-World-Fast。该模型在 480P 分辨率下可实现 16 fps 实时生成,端到端交互延迟控制在 1 秒以内;开发者也可以基于 Hugging Face 和 ModelScope 上开放的模型与代码本地部署。它的方向不是再生成一段离线视频,而是让用户进入一个可操作、可即时响应的环境。对具身智能来说,这类模型可以提供低成本虚拟训练场;对游戏和内容创作来说,它把“世界原型”从渲染管线里抽出来,变成可由图片和提示词驱动的交互对象。
| 指标 | 数据 |
|---|---|
| 模型 | LingBot-World-Fast |
| 发布 / 上线时间 | 2026-04-27 |
| 用户入口 | 灵光 App“体验世界模型” |
| 输入 | 单张图片 / 自然语言指令 |
| 输出 | 最长 60 秒可交互 3D 世界 |
| 实时性能 | 480P,16 fps,端到端延迟 1 秒内 |
| 开源平台 | Hugging Face、ModelScope |
uAI Nexus MedVLM:医疗视频理解开源模型和榜单同步上线
4 月 26 日,量子位报道联影智能开源 uAI Nexus MedVLM(元智医疗视频理解大模型),并同步上线 MedVidBench 测试集和医疗视频理解榜单。该模型面向手术与护理视频理解,支持 4B / 7B 参数规模,单卡可部署;训练数据包含超过 53 万条视频-指令数据,整合 8 个专业医学数据集,覆盖内镜、腹腔镜、开放手术、机器人手术、护理操作等场景。论文已被 CVPR 2026 收录。
医疗视频和普通视觉理解的差异在于,它需要同时处理空间位置、时序动作、器械识别、解剖结构和临床规范。报道提到,团队同步发布了 6245 个视频-指令对构成的标准测试集,并开放动态排行榜。这个动作会让医疗视频理解从“各家各测各的”走向更可比较的基准体系。短期看,它更像临床教学、术后报告、手术质控和研究数据集;长期看,它也可能成为手术机器人、术中辅助和具身医疗系统的感知层基础。
| 指标 | 数据 |
|---|---|
| 模型 | uAI Nexus MedVLM / 元智医疗视频理解大模型 |
| 参数规模 | 4B / 7B |
| 训练数据 | 超 53 万条视频-指令数据 |
| 测试集 | MedVidBench,6245 个视频-指令对 |
| 覆盖任务 | 视频摘要、关键安全视野评估、下一步操作预测、技能评估、时间动作定位、密集视频描述等 |
| 开放内容 | Demo、推理代码、数据集、榜单、论文、项目页 |
Frontier SWE × OpenEnv:长程软件工程环境登上 Hugging Face
Hugging Face 社区 4 月 26 日发布 Frontier SWE × OpenEnv 文章,介绍将 4 个长程软件工程任务打包成 Hugging Face Spaces 上可运行的 Docker 化环境。这些任务包括 notebook 压缩、Postgres wire adapter、依赖类型检查器、libexpat 到 x86-64 汇编等,并提供统一的 Gym 风格 API、MCP 工具、分层奖励和离线训练管线。
这类工作补齐了 Coding Agent 评测里经常缺的一环:真实长程任务不是单次补丁,而是需要规划、执行、验证、提交子任务,并在 45-90 分钟甚至更长的回合里保持状态。它也说明开源社区正在把 Agent 训练环境、奖励函数、轨迹数据和可复现实验一起产品化。模型能力提高之后,谁能提供可重复、可度量、可训练的长程环境,谁就更接近下一轮 Agent 工程基础设施。
融资与交易
Google 与 Anthropic 的算力 / 资本绑定仍在影响市场定价
近 48 小时内,公开可核验的新增融资主线不算密集,但大模型资本市场仍被“算力绑定”主导。TechCrunch 4 月 24 日报道,Google 计划以现金和算力形式向 Anthropic 投入最高 400 亿美元,其中当前承诺 100 亿美元,另有 300 亿美元与 Anthropic 达成特定业绩目标相关。报道提到该交易对应 Anthropic 约 3500 亿美元估值口径。
这条信息虽然发生在 48 小时窗口边缘,但与本周 Claude Code 质量 postmortem、Mythos 受限测试、Google Cloud Next 的 Agent 平台化叙事放在一起看,资本正在押注的不只是一个模型版本,而是模型、云、TPU、企业客户和安全治理共同组成的供应链。
| 日期 | 参与方 | 金额 / 估值 | 内容 |
|---|---|---|---|
| 2026-04-24 | Google / Anthropic | 最高 400 亿美元现金和算力;报道估值约 3500 亿美元 | 支持 Anthropic 模型与算力扩张,部分资金与业绩目标挂钩 |
全球产业动态
中国信通院启动 DeepSeek V4 国产化适配测试
4 月 27 日,中国信通院宣布联合人工智能软硬件协同创新与适配验证中心,正式启动 DeepSeek V4 国产化适配测试工作。测试依托工信部重点实验室,以及 AISHPerf 人工智能软硬件基准体系与测试工具,面向芯片、服务器、一体机、集群、开发框架与工具链、智算设施和平台等产品系统开展。
测试覆盖 DeepSeek V4 全系列模型,聚焦推理、微调等流程,并新增长序列处理、代码生成与理解、智能体调用成功率、任务拆解能力等方向。这个动作把“开源模型发布”推进到“国产软硬件能否同频迭代”的阶段。对于国内 AI 基础设施来说,1M 上下文、思考模式、工具调用和 Agent 评测会直接放大芯片、推理框架、KV cache、集群调度和开发工具链之间的适配压力。
小米投资者日:MiMo-V2.5、Miclaw 与人车家 Agent 中枢
IT之家 4 月 27 日报道,在小米投资者日上,小米集团副总裁、技术委员会主席屈恒围绕“Agent 范式重塑小米与人车家全生态”分享 AI 战略。报道整理称,小米未来三年 AI 投入超过 600 亿元;MiMo-V2.5 即将开源,几乎适配国内所有芯片;小米将把 Agent 能力用于人车家生态和企业效率两条线。
产品路径上,小米把 MiMo、Miclaw、小爱、智能座舱、Miloco 和跨设备共享记忆放在同一张图里。这里的关键不是单个模型,而是端侧芯片、车、手机、平板、音箱、家庭设备和企业流程之间如何共享上下文、权限和记忆。硬件公司做 Agent 的优势在于入口多、传感器多、场景连续;难点也在这里:跨端调度、隐私边界和长期记忆管理会比纯软件 Agent 更复杂。
Claude Code 质量波动 postmortem:Agent 产品层也会“降智”
Anthropic 4 月 23 日发布工程说明,量子位 4 月 26 日集中跟进。官方称,过去一个多月关于 Claude Code 质量下降的反馈,来自三个产品层问题:3 月 4 日将 Claude Code 默认 reasoning effort 从 high 调到 medium,3 月 26 日的缓存优化 bug 导致旧 thinking 在会话后续轮次中被反复清空,4 月 16 日加入的减少冗长输出系统提示伤害了编码质量。Anthropic 表示 API 和推理层未受影响,三个问题已在 4 月 20 日的 v2.1.116 中解决,并重置订阅用户使用额度。
这件事给 Agent 产品敲了一个很具体的钟:用户感知到的“模型聪不聪明”,不只由权重决定,还由 reasoning effort 默认值、系统提示、缓存策略、上下文保留、工具调用历史和 UI 暴露方式共同决定。未来 Coding Agent 的稳定性评估,应该同时看模型 benchmark 和产品层变更记录。
关键数据一览
| 指标 | 数据 |
|---|---|
| DeepSeek API 输入缓存命中降价 | 全系降至原有价格 1/10 |
| DeepSeek-V4-Pro 限时优惠 | 5 月 5 日前叠加 2.5 折 |
| V4-Pro 调价后价格 | 缓存命中输入 0.025 元 / 百万 tokens;未命中输入 3 元;输出 6 元 |
| V4-Flash 调价后价格 | 缓存命中输入 0.02 元 / 百万 tokens;未命中输入 1 元;输出 2 元 |
| 量子位 Agent 编程实测 | 约 3500 万 tokens 成本从 31.73 元降至约 5.34 元,节省约 83% |
| LingBot-World-Fast | 480P、16 fps、端到端延迟 1 秒内 |
| 灵光世界模型体验 | 单图生成最长 60 秒可交互 3D 世界 |
| uAI Nexus MedVLM | 4B / 7B 参数,超 53 万条视频-指令数据 |
| MedVidBench | 6245 个视频-指令对 |
| 小米 AI 投入 | 未来三年超过 600 亿元 |
| MiMo-V2.5 | 即将开源,报道称几乎适配国内所有芯片 |
| Claude Code 修复版本 | 2026-04-20,v2.1.116 |
| Claude Code 受影响层 | Claude Code、Claude Agent SDK、Claude Cowork;API 未受影响 |
| Frontier SWE × OpenEnv | 4 个长程 SWE 环境,支持 MCP 工具和分层奖励 |
Sources
- IT之家 - 降至原有价格 1/10,DeepSeek API 输入缓存降价 - 支撑 DeepSeek API 输入缓存命中降价、V4-Pro / V4-Flash 调价后价格。
- 量子位 - DeepSeek V4 永久降价!缓存命中再打 1 折 - 支撑 DeepSeek 缓存命中率、Agent 编程成本实测和降价影响。
- Reuters via Global Banking & Finance - China's DeepSeek slashes prices for new AI model - 支撑 DeepSeek V4-Pro 75% 折扣、全线输入缓存降价和国际媒体语境。
- 量子位 - 世界模型能实时玩了,蚂蚁灵波开源 LingBot-World-Fast - 支撑 LingBot-World-Fast 开源、实时性能和开发者开放信息。
- 量子位 - 灵光在手机端上线“体验世界模型”功能 - 支撑灵光 App 移动端世界模型体验、交互方式和用户入口。
- 量子位 - 全球首个医疗视频理解大模型开源 - 支撑 uAI Nexus MedVLM、MedVidBench、数据规模、任务覆盖和开源链接。
- Hugging Face Blog - Building long-horizon SWE environments on Hugging Face - 支撑 Frontier SWE × OpenEnv 的长程软件工程环境、MCP 工具、奖励和训练管线。
- TechCrunch - Google to invest up to $40B in Anthropic - 支撑 Google / Anthropic 资本与算力绑定信息。
- IT之家 - 中国信通院正式启动 DeepSeek V4 国产化适配测试工作 - 支撑 DeepSeek V4 国产化适配测试范围、评测维度和 AISHPerf 信息。
- IT之家 - 未来三年小米 AI 投入超 600 亿元 - 支撑小米 AI 投入、MiMo-V2.5、Miclaw、人车家 Agent 和企业效率规划。
- Anthropic Engineering - An update on recent Claude Code quality reports - 支撑 Claude Code 质量问题的官方原因、时间线、修复版本和使用额度重置。
- 量子位 - Claude 终于认了!降智坐实,3 个 bug 全曝光 - 支撑中文社区对 Claude Code postmortem 的集中跟进与影响解读。
本 Newsletter 基于公开信息整理,重点覆盖 2026 年 4 月 25 日至 2026 年 4 月 27 日期间新增、更新或集中发酵的 AI 动态;所有信息均来自公开来源,不构成投资建议。