2026-04-24 AI 动态

2026年4月24日 · 阅读需 14 分钟

本期焦点

DeepSeek-V4 预览版同步开源上线，1M 上下文成为官方服务标配。
OpenAI 发布 GPT-5.5，把重点继续压在 Agentic Coding、电脑使用和知识工作。
Anthropic 复盘 Claude Code 质量波动，产品层改动对 Agent 体验的影响被放到台前。
GitHub Copilot 把 PR、Issue、Project 和云端 Agent 会话进一步打通。
AI 创业融资继续流向“更可靠的 Agent”和 AI 药物研发基础设施。

头条要闻

DeepSeek-V4 预览版上线：1M 上下文从高端能力变成默认配置

4 月 24 日，DeepSeek-V4 预览版正式上线并同步开源，包含 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 两个 MoE 模型。官方 Hugging Face 模型卡显示，V4-Pro 为 1.6T 总参数、49B 激活参数，V4-Flash 为 284B 总参数、13B 激活参数，两者都支持 1M tokens 上下文，采用 MIT 许可证，并提供 Hugging Face 与 ModelScope 下载入口。DeepSeek 把这次发布定义为“高效百万上下文智能”，核心技术包括压缩稀疏注意力 CSA、重压缩注意力 HCA、mHC 连接和 Muon 优化器。

这次更新的关键，不只是参数规模继续变大，而是长上下文的成本结构正在被改写。官方称，在 1M 上下文设置下，DeepSeek-V4-Pro 的单 token 推理 FLOPs 约为 V3.2 的 27%，KV cache 约为 V3.2 的 10%。这意味着长程代码库分析、超长文档处理和多轮 Agent 工作流，正在从“能不能跑”进入“能不能经济地跑”的阶段。对开源生态来说，DeepSeek-V4 会继续把压力传导给两类玩家：一类是闭源模型，需要证明能力和稳定性足以覆盖价格差；另一类是推理基础设施，需要快速跟上新注意力结构和百万上下文部署。

DeepSeek Hugging Face · 量子位 · IT之家

模型发布与更新

OpenAI GPT-5.5

OpenAI 于 4 月 23 日发布 GPT-5.5，并将其定位为面向“真实工作”和 Agent 的新一代模型。官方介绍中，GPT-5.5 的重点能力集中在写代码与调试、在线研究、数据分析、文档和表格生成、软件操作，以及跨工具持续推进任务。OpenAI 同时强调，GPT-5.5 在真实服务中的单 token 延迟与 GPT-5.4 持平，并且在 Codex 任务上用更少 tokens 完成同类工作。

从可用性看，GPT-5.5 已面向 ChatGPT Plus、Pro、Business、Enterprise 和 Codex 推出；GPT-5.5 Pro 面向 Pro、Business、Enterprise 用户。API 仍处在即将开放阶段，OpenAI 给出的计划价格为 gpt-5.5 每 100 万输入 tokens 5 美元、输出 tokens 30 美元，gpt-5.5-pro 每 100 万输入 tokens 30 美元、输出 tokens 180 美元。它传递出的信号是：前沿模型竞争的主战场仍在“长时间执行任务”，而不只是单轮问答或静态榜单。

指标	数据
发布时间	2026-04-23
主要版本	GPT-5.5 / GPT-5.5 Pro
重点场景	Agentic coding、computer use、知识工作、科学研究
Codex 上下文	400K
API 上下文	计划提供 1M
API 价格	gpt-5.5：5 美元/百万输入 tokens、30 美元/百万输出 tokens；gpt-5.5-pro：30 美元/百万输入 tokens、180 美元/百万输出 tokens
关键 benchmark	Terminal-Bench 2.0 82.7%，SWE-Bench Pro 58.6%，OSWorld-Verified 78.7%

OpenAI

DeepSeek-V4-Pro / DeepSeek-V4-Flash

DeepSeek-V4 的产品分层很明确：V4-Pro 对准高复杂度推理、编码和 Agent 任务，V4-Flash 对准更高性价比和更快推理。两者都提供非思考、思考和 Think Max 三类推理强度；复杂 Agent 场景下，官方建议使用思考模式并提高 reasoning effort。IT 之家援引官方信息称，官网、App 和 API 服务已同步更新，开发者可通过 deepseek-v4-pro 或 deepseek-v4-flash 调用；旧模型名 deepseek-chat 和 deepseek-reasoner 将在 2026 年 7 月 24 日停用，当前阶段分别指向 V4-Flash 的非思考和思考模式。

对开发者而言，这次迁移不只是改模型名。V4 的混合注意力、百万上下文和不同 reasoning effort 会改变成本测算方式，也会影响 Agent 框架的上下文裁剪、缓存策略和任务拆分策略。如果 1M 上下文成为默认能力，很多原先靠 RAG、摘要或分段处理勉强完成的任务，会重新面临“直接喂全量上下文”和“外部检索编排”之间的工程取舍。

指标	DeepSeek-V4-Pro	DeepSeek-V4-Flash
总参数	1.6T	284B
激活参数	49B	13B
上下文窗口	1M tokens	1M tokens
精度	FP4 + FP8 Mixed	FP4 + FP8 Mixed
许可证	MIT	MIT
推理模式	Non-think / Think / Think Max	Non-think / Think / Think Max
典型定位	高难推理、Coding、长程 Agent	经济型任务、日常 Agent、吞吐优先场景

DeepSeek Hugging Face · DeepSeek V4 Flash · IT之家

融资与交易

NeoCognition：4000 万美元种子轮押注自学习 Agent

TechCrunch 4 月 21 日报道，AI Agent 研究型创业公司 NeoCognition 完成 4000 万美元种子轮融资，由 Cambium Capital 和 Walden Catalyst Ventures 联合领投，Vista Equity Partners 以及 Intel CEO Lip-Bu Tan、Databricks 联合创始人 Ion Stoica 等个人投资者参与。公司由俄亥俄州立大学教授 Yu Su 创立，方向是让 Agent 能够围绕特定职业、环境和任务自主学习，形成面向“微观世界”的专业能力。

这类公司受资本关注，说明 Agent 赛道的评价标准正在从“能调用工具”转向“能不能长期变得更可靠”。通用 Agent 在演示里可以覆盖很多任务，但进入真实业务以后，往往需要理解企业流程、行业术语、局部约束和历史上下文。NeoCognition 押注的自学习路线，本质上是在解决从通才到专家的迁移问题。

日期	参与方	金额	内容
2026-04-21	NeoCognition / Cambium Capital / Walden Catalyst Ventures 等	4000 万美元	种子轮融资，用于开发可自主学习的 AI Agent

TechCrunch

10x Science：AI 药物候选物爆发后，筛选和表征成为新瓶颈

TechCrunch 4 月 22 日报道，10x Science 完成 480 万美元种子轮融资，由 Initialized Capital 领投，Y Combinator、Civilization Ventures 和 Founder Factor 参与。公司成立于 2025 年 12 月，试图解决 AI 药物发现中的一个后续瓶颈：模型可以生成越来越多潜在候选物，但实验室需要更高效地判断哪些候选物真正值得测试、放大和生产。

AI for Science 的商业化不会只停留在“生成候选分子”。当候选物数量大幅上升以后，湿实验、表征、可制造性和验证流程会成为新的稀缺环节。10x Science 代表的方向，是把 AI 的价值从发现端延伸到实验决策端，帮助研发团队在更多可能性里更快排除噪声。

日期	参与方	金额	内容
2026-04-22	10x Science / Initialized Capital / YC 等	480 万美元	种子轮融资，面向 AI 药物候选物筛选和表征

TechCrunch

全球产业动态

Anthropic 复盘 Claude Code 质量波动：Agent 体验不只由底层模型决定

4 月 23 日，Anthropic 发布 Claude Code 质量问题复盘，确认近期用户感知到的能力下降来自三类产品层问题，而非 API 或推理层被有意削弱。第一，3 月 4 日将 Claude Code 默认 reasoning effort 从 high 改为 medium 以降低延迟，后来在 4 月 7 日回滚；第二，3 月 26 日的会话清理 bug 导致旧 thinking 被反复丢弃，让 Claude 显得健忘、重复；第三，4 月 16 日新增的限长系统提示伤害了编码质量，并于 4 月 20 日回滚。

这份复盘对 Agent 产品很有参考价值：模型“变笨”有时并不是模型权重变了，而是 harness、提示词、缓存、上下文管理和默认推理强度共同塑造了最终体验。随着 Coding Agent 进入日常工程工作流，产品团队需要把这些层都纳入可观测、可回滚、可评测的范围。否则一个看似合理的延迟优化，就可能被用户感知为能力退化。

Anthropic Engineering

GitHub Copilot：从聊天助手继续走向工程工作流界面

GitHub 在 4 月 22 日至 23 日连续更新 Copilot。PR 场景里，Copilot Chat 现在可以把评论、文件变更、提交和评审作为上下文，支持 PR 理解、结构化评审和摘要；Issue 和 Project 场景里，用户可以直接查看和管理云端 Agent 会话，包括进度、日志和继续给 Agent 指令；调试场景里，Copilot Chat 在 github.com 上识别堆栈跟踪后，会按失败位置、原因、根因、证据、置信度和后续检查组织分析。VS Code 中，Copilot Business 和 Enterprise 用户也可以配置 BYOK，把 Anthropic、Gemini、OpenAI、OpenRouter、Azure 以及本地 Ollama、Foundry Local 等模型接入 VS Code Chat。

这些更新的共同方向，是把 Agent 从一个独立聊天入口嵌回软件工程对象本身：PR、Issue、Project、stack trace、Jira 和 VS Code。开发者并不总想“去问 AI”，更自然的路径是在当前工件上直接让 AI 解释、评审、修复或继续执行。GitHub 的优势在于工程对象和协作状态都在平台里，这让 Copilot 更容易成为工作流层，而不是另一个外部工具。

GitHub Changelog - PR · GitHub Changelog - Agent Sessions · GitHub Changelog - Debugging · GitHub Changelog - BYOK

国产算力快速适配 DeepSeek-V4：模型发布当天即进入推理生态竞争

DeepSeek-V4 发布当天，国产算力和云服务厂商迅速跟进。寒武纪宣布基于 vLLM 推理框架完成对 284B DeepSeek-V4-Flash 和 1.6T DeepSeek-V4-Pro 的 Day 0 适配，适配代码已开源到 GitHub 社区，并针对 Compressor、mHC、稀疏 / 压缩 Attention、GroupGemm 等结构做专项优化。华为宣布昇腾超节点系列产品全面支持 DeepSeek-V4；华为云也宣布首发适配 DeepSeek-V4，提供免部署、一键调用的 DeepSeek-V4-Flash API Tokens 服务。

这条线索比单纯“哪个模型更强”更产业化。百万上下文和复杂 MoE 结构会把推理系统的压力扩散到算子、并行策略、KV cache 管理、低精度量化、Serving 调度和云 API 封装。模型公司把权重开出来只是第一步，谁能让它稳定、便宜、低延迟地跑起来，谁就能在下一轮国产 AI 基础设施竞争里获得更多开发者入口。

IT之家 - 寒武纪 · IT之家 - 昇腾 · IT之家 - 华为云

关键数据一览

指标	数据
DeepSeek-V4-Pro	1.6T 总参数 / 49B 激活参数 / 1M 上下文
DeepSeek-V4-Flash	284B 总参数 / 13B 激活参数 / 1M 上下文
DeepSeek-V4 训练数据	32T+ tokens
DeepSeek-V4-Pro 长上下文效率	1M 上下文下单 token 推理 FLOPs 约为 V3.2 的 27%，KV cache 约为 10%
DeepSeek 旧 API 名停用时间	2026-07-24
GPT-5.5 Terminal-Bench 2.0	82.7%
GPT-5.5 SWE-Bench Pro	58.6%
GPT-5.5 API 计划价格	5 美元/百万输入 tokens，30 美元/百万输出 tokens
GPT-5.5 Pro API 计划价格	30 美元/百万输入 tokens，180 美元/百万输出 tokens
NeoCognition 种子轮	4000 万美元
10x Science 种子轮	480 万美元
Anthropic Claude Code 修复版本	2026-04-20，v2.1.116

Sources

DeepSeek-V4-Pro Model Card - 支撑 DeepSeek-V4-Pro / V4-Flash 的参数规模、1M 上下文、架构、训练数据、reasoning modes、MIT 许可和 benchmark 数据。
DeepSeek-V4-Flash Model Card - 支撑 V4-Flash 的参数规模、上下文、许可和模型下载信息。
量子位 - DeepSeek V4 终于发布 - 提供中文语境下对 DeepSeek-V4 发布、API、官方服务和国产算力适配节奏的补充解读。
IT之家 - DeepSeek-V4 模型预览版正式上线并同步开源 - 支撑 DeepSeek-V4 上线、官网 / App / API 接入、旧模型名停用和 reasoning effort 信息。
OpenAI - Introducing GPT-5.5 - 支撑 GPT-5.5 的发布时间、能力定位、可用范围、价格计划和 benchmark 数据。
Anthropic Engineering - An update on recent Claude Code quality reports - 支撑 Claude Code 质量波动的三类原因、修复时间和后续改进计划。
GitHub Changelog - Copilot Chat improvements for pull requests - 支撑 Copilot PR 理解、评审和摘要更新。
GitHub Changelog - View and manage agent sessions from issues and projects - 支撑 Copilot 云端 Agent 会话在 Issue 和 Project 中的可视化与管理。
GitHub Changelog - Better debugging with GitHub Copilot on the web - 支撑 Copilot 对 stack trace 的结构化根因分析。
GitHub Changelog - Bring your own language model key in VS Code - 支撑 VS Code BYOK、支持模型来源和适用范围。
IT之家 - 寒武纪 Day 0 适配 DeepSeek-V4 - 支撑寒武纪基于 vLLM 对 DeepSeek-V4 的 Day 0 适配和算子优化信息。
IT之家 - 华为昇腾超节点支持 DeepSeek V4 - 支撑昇腾超节点适配 DeepSeek-V4 以及部分吞吐数据。
IT之家 - 华为云首发适配 DeepSeek-V4 - 支撑华为云 MaaS Tokens 服务、1M 上下文推理和 KV cache 管理优化信息。
TechCrunch - NeoCognition lands 40M seed - 支撑 NeoCognition 融资金额、投资方和自学习 Agent 方向。
TechCrunch - 10x Science seed round - 支撑 10x Science 融资金额、投资方和 AI 药物候选物筛选方向。

本期 Newsletter 基于公开信息整理，重点覆盖 2026 年 4 月 22 日至 2026 年 4 月 24 日期间新增或集中披露的 AI 动态；所有信息均来自公开来源，不构成投资建议。

头条要闻​

DeepSeek-V4 预览版上线：1M 上下文从高端能力变成默认配置​

模型发布与更新​

OpenAI GPT-5.5​

DeepSeek-V4-Pro / DeepSeek-V4-Flash​

融资与交易​

NeoCognition：4000 万美元种子轮押注自学习 Agent​

10x Science：AI 药物候选物爆发后，筛选和表征成为新瓶颈​

全球产业动态​

Anthropic 复盘 Claude Code 质量波动：Agent 体验不只由底层模型决定​

GitHub Copilot：从聊天助手继续走向工程工作流界面​

国产算力快速适配 DeepSeek-V4：模型发布当天即进入推理生态竞争​

关键数据一览​

Sources​