跳到主要内容

2026-04-27 AI 动态

· 阅读需 13 分钟
本期焦点
  1. DeepSeek API 输入缓存命中价格降至原有 1/10,V4-Pro 叠加限时 2.5 折。
  2. 蚂蚁灵波开源 LingBot-World-Fast,灵光 App 上线移动端世界模型体验。
  3. 联影智能开源 uAI Nexus MedVLM 和 MedVidBench,医疗视频理解有了公共评测标尺。
  4. 小米称未来三年 AI 投入超 600 亿元,MiMo-V2.5 即将开源。
  5. Anthropic 公开解释 Claude Code 质量波动,Agent 产品层可靠性成为显性议题。

头条要闻

DeepSeek-V4 价格战继续:缓存命中成本降至原有 1/10

4 月 26 日晚至 4 月 27 日,DeepSeek-V4 的产品主线从“百万上下文开源模型”快速转向“百万上下文能不能便宜地用起来”。IT之家报道,DeepSeek 全系 API 服务的输入缓存命中价格即日起降至原有价格的 1/10,DeepSeek-V4-Pro 还可在 5 月 5 日前叠加 2.5 折限时优惠。调价后,DeepSeek-V4-Pro 输入缓存命中价格为 0.025 元 / 百万 tokens,缓存未命中输入为 3 元 / 百万 tokens,输出为 6 元 / 百万 tokens;DeepSeek-V4-Flash 输入缓存命中价格为 0.02 元 / 百万 tokens,缓存未命中输入为 1 元 / 百万 tokens,输出为 2 元 / 百万 tokens。

这次降价对 Agent 工作流的影响比普通聊天更大。长程代码、RAG、浏览器自动化和多工具调用通常会反复携带系统提示、工具定义、代码上下文和历史轨迹,输入 token 占比远高于输出。量子位实测称,在 Agent 编程任务中,V4-Pro 输入缓存命中率约 95%,V4-Flash 约 91%;其一轮约 3500 万 tokens 的测试成本可从 31.73 元降到约 5.34 元,整体节省约 83%。Reuters 转述也把这次 V4-Pro 75% 折扣和全线输入缓存降价,放在中国 AI 价格竞争的语境里观察。

IT之家 · 量子位 · Reuters via Global Banking & Finance


模型发布与更新

LingBot-World-Fast:世界模型第一次进入普通手机体验

4 月 27 日,蚂蚁灵光 App 上线“体验世界模型”功能。用户上传一张图片,就可以在手机端生成最长 60 秒的 3D 世界,并用类似手游摇杆的方式以第一人称视角移动和观察。量子位称,这是世界模型首次以移动端产品形态面向普通用户开放。

支撑这一体验的是蚂蚁灵波开源的 LingBot-World-Fast。该模型在 480P 分辨率下可实现 16 fps 实时生成,端到端交互延迟控制在 1 秒以内;开发者也可以基于 Hugging Face 和 ModelScope 上开放的模型与代码本地部署。它的方向不是再生成一段离线视频,而是让用户进入一个可操作、可即时响应的环境。对具身智能来说,这类模型可以提供低成本虚拟训练场;对游戏和内容创作来说,它把“世界原型”从渲染管线里抽出来,变成可由图片和提示词驱动的交互对象。

指标数据
模型LingBot-World-Fast
发布 / 上线时间2026-04-27
用户入口灵光 App“体验世界模型”
输入单张图片 / 自然语言指令
输出最长 60 秒可交互 3D 世界
实时性能480P,16 fps,端到端延迟 1 秒内
开源平台Hugging Face、ModelScope

量子位 · 量子位


uAI Nexus MedVLM:医疗视频理解开源模型和榜单同步上线

4 月 26 日,量子位报道联影智能开源 uAI Nexus MedVLM(元智医疗视频理解大模型),并同步上线 MedVidBench 测试集和医疗视频理解榜单。该模型面向手术与护理视频理解,支持 4B / 7B 参数规模,单卡可部署;训练数据包含超过 53 万条视频-指令数据,整合 8 个专业医学数据集,覆盖内镜、腹腔镜、开放手术、机器人手术、护理操作等场景。论文已被 CVPR 2026 收录。

医疗视频和普通视觉理解的差异在于,它需要同时处理空间位置、时序动作、器械识别、解剖结构和临床规范。报道提到,团队同步发布了 6245 个视频-指令对构成的标准测试集,并开放动态排行榜。这个动作会让医疗视频理解从“各家各测各的”走向更可比较的基准体系。短期看,它更像临床教学、术后报告、手术质控和研究数据集;长期看,它也可能成为手术机器人、术中辅助和具身医疗系统的感知层基础。

指标数据
模型uAI Nexus MedVLM / 元智医疗视频理解大模型
参数规模4B / 7B
训练数据超 53 万条视频-指令数据
测试集MedVidBench,6245 个视频-指令对
覆盖任务视频摘要、关键安全视野评估、下一步操作预测、技能评估、时间动作定位、密集视频描述等
开放内容Demo、推理代码、数据集、榜单、论文、项目页

量子位


Frontier SWE × OpenEnv:长程软件工程环境登上 Hugging Face

Hugging Face 社区 4 月 26 日发布 Frontier SWE × OpenEnv 文章,介绍将 4 个长程软件工程任务打包成 Hugging Face Spaces 上可运行的 Docker 化环境。这些任务包括 notebook 压缩、Postgres wire adapter、依赖类型检查器、libexpat 到 x86-64 汇编等,并提供统一的 Gym 风格 API、MCP 工具、分层奖励和离线训练管线。

这类工作补齐了 Coding Agent 评测里经常缺的一环:真实长程任务不是单次补丁,而是需要规划、执行、验证、提交子任务,并在 45-90 分钟甚至更长的回合里保持状态。它也说明开源社区正在把 Agent 训练环境、奖励函数、轨迹数据和可复现实验一起产品化。模型能力提高之后,谁能提供可重复、可度量、可训练的长程环境,谁就更接近下一轮 Agent 工程基础设施。

Hugging Face Blog


融资与交易

Google 与 Anthropic 的算力 / 资本绑定仍在影响市场定价

近 48 小时内,公开可核验的新增融资主线不算密集,但大模型资本市场仍被“算力绑定”主导。TechCrunch 4 月 24 日报道,Google 计划以现金和算力形式向 Anthropic 投入最高 400 亿美元,其中当前承诺 100 亿美元,另有 300 亿美元与 Anthropic 达成特定业绩目标相关。报道提到该交易对应 Anthropic 约 3500 亿美元估值口径。

这条信息虽然发生在 48 小时窗口边缘,但与本周 Claude Code 质量 postmortem、Mythos 受限测试、Google Cloud Next 的 Agent 平台化叙事放在一起看,资本正在押注的不只是一个模型版本,而是模型、云、TPU、企业客户和安全治理共同组成的供应链。

日期参与方金额 / 估值内容
2026-04-24Google / Anthropic最高 400 亿美元现金和算力;报道估值约 3500 亿美元支持 Anthropic 模型与算力扩张,部分资金与业绩目标挂钩

TechCrunch


全球产业动态

中国信通院启动 DeepSeek V4 国产化适配测试

4 月 27 日,中国信通院宣布联合人工智能软硬件协同创新与适配验证中心,正式启动 DeepSeek V4 国产化适配测试工作。测试依托工信部重点实验室,以及 AISHPerf 人工智能软硬件基准体系与测试工具,面向芯片、服务器、一体机、集群、开发框架与工具链、智算设施和平台等产品系统开展。

测试覆盖 DeepSeek V4 全系列模型,聚焦推理、微调等流程,并新增长序列处理、代码生成与理解、智能体调用成功率、任务拆解能力等方向。这个动作把“开源模型发布”推进到“国产软硬件能否同频迭代”的阶段。对于国内 AI 基础设施来说,1M 上下文、思考模式、工具调用和 Agent 评测会直接放大芯片、推理框架、KV cache、集群调度和开发工具链之间的适配压力。

IT之家


小米投资者日:MiMo-V2.5、Miclaw 与人车家 Agent 中枢

IT之家 4 月 27 日报道,在小米投资者日上,小米集团副总裁、技术委员会主席屈恒围绕“Agent 范式重塑小米与人车家全生态”分享 AI 战略。报道整理称,小米未来三年 AI 投入超过 600 亿元;MiMo-V2.5 即将开源,几乎适配国内所有芯片;小米将把 Agent 能力用于人车家生态和企业效率两条线。

产品路径上,小米把 MiMo、Miclaw、小爱、智能座舱、Miloco 和跨设备共享记忆放在同一张图里。这里的关键不是单个模型,而是端侧芯片、车、手机、平板、音箱、家庭设备和企业流程之间如何共享上下文、权限和记忆。硬件公司做 Agent 的优势在于入口多、传感器多、场景连续;难点也在这里:跨端调度、隐私边界和长期记忆管理会比纯软件 Agent 更复杂。

IT之家


Claude Code 质量波动 postmortem:Agent 产品层也会“降智”

Anthropic 4 月 23 日发布工程说明,量子位 4 月 26 日集中跟进。官方称,过去一个多月关于 Claude Code 质量下降的反馈,来自三个产品层问题:3 月 4 日将 Claude Code 默认 reasoning effort 从 high 调到 medium,3 月 26 日的缓存优化 bug 导致旧 thinking 在会话后续轮次中被反复清空,4 月 16 日加入的减少冗长输出系统提示伤害了编码质量。Anthropic 表示 API 和推理层未受影响,三个问题已在 4 月 20 日的 v2.1.116 中解决,并重置订阅用户使用额度。

这件事给 Agent 产品敲了一个很具体的钟:用户感知到的“模型聪不聪明”,不只由权重决定,还由 reasoning effort 默认值、系统提示、缓存策略、上下文保留、工具调用历史和 UI 暴露方式共同决定。未来 Coding Agent 的稳定性评估,应该同时看模型 benchmark 和产品层变更记录。

Anthropic Engineering · 量子位


关键数据一览

指标数据
DeepSeek API 输入缓存命中降价全系降至原有价格 1/10
DeepSeek-V4-Pro 限时优惠5 月 5 日前叠加 2.5 折
V4-Pro 调价后价格缓存命中输入 0.025 元 / 百万 tokens;未命中输入 3 元;输出 6 元
V4-Flash 调价后价格缓存命中输入 0.02 元 / 百万 tokens;未命中输入 1 元;输出 2 元
量子位 Agent 编程实测约 3500 万 tokens 成本从 31.73 元降至约 5.34 元,节省约 83%
LingBot-World-Fast480P、16 fps、端到端延迟 1 秒内
灵光世界模型体验单图生成最长 60 秒可交互 3D 世界
uAI Nexus MedVLM4B / 7B 参数,超 53 万条视频-指令数据
MedVidBench6245 个视频-指令对
小米 AI 投入未来三年超过 600 亿元
MiMo-V2.5即将开源,报道称几乎适配国内所有芯片
Claude Code 修复版本2026-04-20,v2.1.116
Claude Code 受影响层Claude Code、Claude Agent SDK、Claude Cowork;API 未受影响
Frontier SWE × OpenEnv4 个长程 SWE 环境,支持 MCP 工具和分层奖励

Sources


本 Newsletter 基于公开信息整理,重点覆盖 2026 年 4 月 25 日至 2026 年 4 月 27 日期间新增、更新或集中发酵的 AI 动态;所有信息均来自公开来源,不构成投资建议。