跳到主要内容

2026-04-24 AI 动态

· 阅读需 14 分钟
本期焦点
  1. DeepSeek-V4 预览版同步开源上线,1M 上下文成为官方服务标配。
  2. OpenAI 发布 GPT-5.5,把重点继续压在 Agentic Coding、电脑使用和知识工作。
  3. Anthropic 复盘 Claude Code 质量波动,产品层改动对 Agent 体验的影响被放到台前。
  4. GitHub Copilot 把 PR、Issue、Project 和云端 Agent 会话进一步打通。
  5. AI 创业融资继续流向“更可靠的 Agent”和 AI 药物研发基础设施。

头条要闻

DeepSeek-V4 预览版上线:1M 上下文从高端能力变成默认配置

4 月 24 日,DeepSeek-V4 预览版正式上线并同步开源,包含 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 两个 MoE 模型。官方 Hugging Face 模型卡显示,V4-Pro 为 1.6T 总参数、49B 激活参数,V4-Flash 为 284B 总参数、13B 激活参数,两者都支持 1M tokens 上下文,采用 MIT 许可证,并提供 Hugging Face 与 ModelScope 下载入口。DeepSeek 把这次发布定义为“高效百万上下文智能”,核心技术包括压缩稀疏注意力 CSA、重压缩注意力 HCA、mHC 连接和 Muon 优化器。

这次更新的关键,不只是参数规模继续变大,而是长上下文的成本结构正在被改写。官方称,在 1M 上下文设置下,DeepSeek-V4-Pro 的单 token 推理 FLOPs 约为 V3.2 的 27%,KV cache 约为 V3.2 的 10%。这意味着长程代码库分析、超长文档处理和多轮 Agent 工作流,正在从“能不能跑”进入“能不能经济地跑”的阶段。对开源生态来说,DeepSeek-V4 会继续把压力传导给两类玩家:一类是闭源模型,需要证明能力和稳定性足以覆盖价格差;另一类是推理基础设施,需要快速跟上新注意力结构和百万上下文部署。

DeepSeek Hugging Face · 量子位 · IT之家


模型发布与更新

OpenAI GPT-5.5

OpenAI 于 4 月 23 日发布 GPT-5.5,并将其定位为面向“真实工作”和 Agent 的新一代模型。官方介绍中,GPT-5.5 的重点能力集中在写代码与调试、在线研究、数据分析、文档和表格生成、软件操作,以及跨工具持续推进任务。OpenAI 同时强调,GPT-5.5 在真实服务中的单 token 延迟与 GPT-5.4 持平,并且在 Codex 任务上用更少 tokens 完成同类工作。

从可用性看,GPT-5.5 已面向 ChatGPT Plus、Pro、Business、Enterprise 和 Codex 推出;GPT-5.5 Pro 面向 Pro、Business、Enterprise 用户。API 仍处在即将开放阶段,OpenAI 给出的计划价格为 gpt-5.5 每 100 万输入 tokens 5 美元、输出 tokens 30 美元,gpt-5.5-pro 每 100 万输入 tokens 30 美元、输出 tokens 180 美元。它传递出的信号是:前沿模型竞争的主战场仍在“长时间执行任务”,而不只是单轮问答或静态榜单。

指标数据
发布时间2026-04-23
主要版本GPT-5.5 / GPT-5.5 Pro
重点场景Agentic coding、computer use、知识工作、科学研究
Codex 上下文400K
API 上下文计划提供 1M
API 价格gpt-5.5:5 美元/百万输入 tokens、30 美元/百万输出 tokens;gpt-5.5-pro:30 美元/百万输入 tokens、180 美元/百万输出 tokens
关键 benchmarkTerminal-Bench 2.0 82.7%,SWE-Bench Pro 58.6%,OSWorld-Verified 78.7%

OpenAI


DeepSeek-V4-Pro / DeepSeek-V4-Flash

DeepSeek-V4 的产品分层很明确:V4-Pro 对准高复杂度推理、编码和 Agent 任务,V4-Flash 对准更高性价比和更快推理。两者都提供非思考、思考和 Think Max 三类推理强度;复杂 Agent 场景下,官方建议使用思考模式并提高 reasoning effort。IT 之家援引官方信息称,官网、App 和 API 服务已同步更新,开发者可通过 deepseek-v4-prodeepseek-v4-flash 调用;旧模型名 deepseek-chatdeepseek-reasoner 将在 2026 年 7 月 24 日停用,当前阶段分别指向 V4-Flash 的非思考和思考模式。

对开发者而言,这次迁移不只是改模型名。V4 的混合注意力、百万上下文和不同 reasoning effort 会改变成本测算方式,也会影响 Agent 框架的上下文裁剪、缓存策略和任务拆分策略。如果 1M 上下文成为默认能力,很多原先靠 RAG、摘要或分段处理勉强完成的任务,会重新面临“直接喂全量上下文”和“外部检索编排”之间的工程取舍。

指标DeepSeek-V4-ProDeepSeek-V4-Flash
总参数1.6T284B
激活参数49B13B
上下文窗口1M tokens1M tokens
精度FP4 + FP8 MixedFP4 + FP8 Mixed
许可证MITMIT
推理模式Non-think / Think / Think MaxNon-think / Think / Think Max
典型定位高难推理、Coding、长程 Agent经济型任务、日常 Agent、吞吐优先场景

DeepSeek Hugging Face · DeepSeek V4 Flash · IT之家


融资与交易

NeoCognition:4000 万美元种子轮押注自学习 Agent

TechCrunch 4 月 21 日报道,AI Agent 研究型创业公司 NeoCognition 完成 4000 万美元种子轮融资,由 Cambium Capital 和 Walden Catalyst Ventures 联合领投,Vista Equity Partners 以及 Intel CEO Lip-Bu Tan、Databricks 联合创始人 Ion Stoica 等个人投资者参与。公司由俄亥俄州立大学教授 Yu Su 创立,方向是让 Agent 能够围绕特定职业、环境和任务自主学习,形成面向“微观世界”的专业能力。

这类公司受资本关注,说明 Agent 赛道的评价标准正在从“能调用工具”转向“能不能长期变得更可靠”。通用 Agent 在演示里可以覆盖很多任务,但进入真实业务以后,往往需要理解企业流程、行业术语、局部约束和历史上下文。NeoCognition 押注的自学习路线,本质上是在解决从通才到专家的迁移问题。

日期参与方金额内容
2026-04-21NeoCognition / Cambium Capital / Walden Catalyst Ventures 等4000 万美元种子轮融资,用于开发可自主学习的 AI Agent

TechCrunch


10x Science:AI 药物候选物爆发后,筛选和表征成为新瓶颈

TechCrunch 4 月 22 日报道,10x Science 完成 480 万美元种子轮融资,由 Initialized Capital 领投,Y Combinator、Civilization Ventures 和 Founder Factor 参与。公司成立于 2025 年 12 月,试图解决 AI 药物发现中的一个后续瓶颈:模型可以生成越来越多潜在候选物,但实验室需要更高效地判断哪些候选物真正值得测试、放大和生产。

AI for Science 的商业化不会只停留在“生成候选分子”。当候选物数量大幅上升以后,湿实验、表征、可制造性和验证流程会成为新的稀缺环节。10x Science 代表的方向,是把 AI 的价值从发现端延伸到实验决策端,帮助研发团队在更多可能性里更快排除噪声。

日期参与方金额内容
2026-04-2210x Science / Initialized Capital / YC 等480 万美元种子轮融资,面向 AI 药物候选物筛选和表征

TechCrunch


全球产业动态

Anthropic 复盘 Claude Code 质量波动:Agent 体验不只由底层模型决定

4 月 23 日,Anthropic 发布 Claude Code 质量问题复盘,确认近期用户感知到的能力下降来自三类产品层问题,而非 API 或推理层被有意削弱。第一,3 月 4 日将 Claude Code 默认 reasoning effort 从 high 改为 medium 以降低延迟,后来在 4 月 7 日回滚;第二,3 月 26 日的会话清理 bug 导致旧 thinking 被反复丢弃,让 Claude 显得健忘、重复;第三,4 月 16 日新增的限长系统提示伤害了编码质量,并于 4 月 20 日回滚。

这份复盘对 Agent 产品很有参考价值:模型“变笨”有时并不是模型权重变了,而是 harness、提示词、缓存、上下文管理和默认推理强度共同塑造了最终体验。随着 Coding Agent 进入日常工程工作流,产品团队需要把这些层都纳入可观测、可回滚、可评测的范围。否则一个看似合理的延迟优化,就可能被用户感知为能力退化。

Anthropic Engineering


GitHub Copilot:从聊天助手继续走向工程工作流界面

GitHub 在 4 月 22 日至 23 日连续更新 Copilot。PR 场景里,Copilot Chat 现在可以把评论、文件变更、提交和评审作为上下文,支持 PR 理解、结构化评审和摘要;Issue 和 Project 场景里,用户可以直接查看和管理云端 Agent 会话,包括进度、日志和继续给 Agent 指令;调试场景里,Copilot Chat 在 github.com 上识别堆栈跟踪后,会按失败位置、原因、根因、证据、置信度和后续检查组织分析。VS Code 中,Copilot Business 和 Enterprise 用户也可以配置 BYOK,把 Anthropic、Gemini、OpenAI、OpenRouter、Azure 以及本地 Ollama、Foundry Local 等模型接入 VS Code Chat。

这些更新的共同方向,是把 Agent 从一个独立聊天入口嵌回软件工程对象本身:PR、Issue、Project、stack trace、Jira 和 VS Code。开发者并不总想“去问 AI”,更自然的路径是在当前工件上直接让 AI 解释、评审、修复或继续执行。GitHub 的优势在于工程对象和协作状态都在平台里,这让 Copilot 更容易成为工作流层,而不是另一个外部工具。

GitHub Changelog - PR · GitHub Changelog - Agent Sessions · GitHub Changelog - Debugging · GitHub Changelog - BYOK


国产算力快速适配 DeepSeek-V4:模型发布当天即进入推理生态竞争

DeepSeek-V4 发布当天,国产算力和云服务厂商迅速跟进。寒武纪宣布基于 vLLM 推理框架完成对 284B DeepSeek-V4-Flash 和 1.6T DeepSeek-V4-Pro 的 Day 0 适配,适配代码已开源到 GitHub 社区,并针对 Compressor、mHC、稀疏 / 压缩 Attention、GroupGemm 等结构做专项优化。华为宣布昇腾超节点系列产品全面支持 DeepSeek-V4;华为云也宣布首发适配 DeepSeek-V4,提供免部署、一键调用的 DeepSeek-V4-Flash API Tokens 服务。

这条线索比单纯“哪个模型更强”更产业化。百万上下文和复杂 MoE 结构会把推理系统的压力扩散到算子、并行策略、KV cache 管理、低精度量化、Serving 调度和云 API 封装。模型公司把权重开出来只是第一步,谁能让它稳定、便宜、低延迟地跑起来,谁就能在下一轮国产 AI 基础设施竞争里获得更多开发者入口。

IT之家 - 寒武纪 · IT之家 - 昇腾 · IT之家 - 华为云


关键数据一览

指标数据
DeepSeek-V4-Pro1.6T 总参数 / 49B 激活参数 / 1M 上下文
DeepSeek-V4-Flash284B 总参数 / 13B 激活参数 / 1M 上下文
DeepSeek-V4 训练数据32T+ tokens
DeepSeek-V4-Pro 长上下文效率1M 上下文下单 token 推理 FLOPs 约为 V3.2 的 27%,KV cache 约为 10%
DeepSeek 旧 API 名停用时间2026-07-24
GPT-5.5 Terminal-Bench 2.082.7%
GPT-5.5 SWE-Bench Pro58.6%
GPT-5.5 API 计划价格5 美元/百万输入 tokens,30 美元/百万输出 tokens
GPT-5.5 Pro API 计划价格30 美元/百万输入 tokens,180 美元/百万输出 tokens
NeoCognition 种子轮4000 万美元
10x Science 种子轮480 万美元
Anthropic Claude Code 修复版本2026-04-20,v2.1.116

Sources


本期 Newsletter 基于公开信息整理,重点覆盖 2026 年 4 月 22 日至 2026 年 4 月 24 日期间新增或集中披露的 AI 动态;所有信息均来自公开来源,不构成投资建议。