2026-05-20 AI 动态

2026年5月20日 · 阅读需 8 分钟

本期焦点

阿里发布 Qwen3.7-Max，强调 35 小时长程智能体自主进化。
Google 披露月处理超 3200 万亿 Token，Gemini App 月活超 9 亿。
openJiuwen 开源 JiuwenSwarm，把多 Agent 协同工程化。
CX-Mind 用可验证推理推进胸片诊断大模型。
百度萝卜快跑周订单突破 35 万，开始进入单城盈利阶段。

头条要闻

Qwen3.7-Max 正式发布：长程 Agent 自主进化成为旗舰模型卖点

5 月 20 日，阿里巴巴在 2026 阿里云峰会上发布新一代千问旗舰模型 Qwen3.7-Max。每日经济新闻报道称，Qwen3.7-Max 在第三方机构 Arena 全球大模型盲测总榜中超过 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，位列国产模型第一，并接近 GPT、Claude、Gemini 最强模型阵营。

这次发布最值得跟踪的是长程智能体能力。报道称，Qwen3.7-Max 在一个全新芯片平台上通过自主编程和超过 1000 次工具调用，实现关键内核自我进化，推理速度较原版本提升 10 倍，任务持续时间达到 35 小时。阿里云同时宣布面向 Agentic 时代升级“芯-云-模型-推理”技术体系，Qwen3.7-Max API 即将上线阿里云百炼，Qwen3.7 系列还将推出 Qwen3.7-Plus 等版本。

指标	数据
模型	Qwen3.7-Max
发布时间	2026-05-20
发布场景	2026 阿里云峰会
定位	面向 Agentic 时代的新一代旗舰模型
Arena 口径	报道称位列国产模型第一
长程任务	报道称可自主完成 35 小时复杂 Agent 任务
工具调用	超过 1000 次工具调用
内核优化	推理速度较原版本提升 10 倍
API	即将上线阿里云百炼

每日经济新闻 via 新浪财经 · 搜狐 / IT之家

Google AI 规模数据：月处理 Token 超 3200 万亿

IT之家 5 月 20 日报道，Google CEO Sundar Pichai 在 Google I/O 2026 开场披露，2026 年 5 月 Google 每月处理超过 3200 万亿 Token，同比增长 7 倍；Gemini App 月活超过 9 亿，同比增长超过 1 倍；每日请求量增长超过 7 倍；Nano Banana 模型累计生成超过 500 亿张图片。

这些数字比单个模型发布更能说明 AI 产业阶段变化。Google 已经把 Gemini 接入 Search、Android、Workspace、Shopping、YouTube、Chrome 和开发者平台，Token 规模不只是聊天需求增长，也来自搜索、生成、Agent、工具调用和多模态工作流的复合增长。对整个行业来说，Token 处理规模正在成为比“模型参数量”更接近真实业务负载的指标。

指标	数据
Google 月处理 Token	超 3200 万亿
同比增长	7 倍
Gemini App 月活	超 9 亿
Gemini App 同比增长	超 1 倍
每日请求量	同比增长超 7 倍
Nano Banana 图片生成	累计超 500 亿张

IT之家 · Google Blog

模型发布与产品更新

JiuwenSwarm：多智能体协作从“编排”走向 Coordination Engineering

5 月 18 日，openJiuwen 社区发布并开源 JiuwenSwarm，5 月 20 日仍在国内开发者社区传播。该项目提出 Coordination Engineering（协同工程）范式，围绕 Agent Swarm、Swarm Skills、Swarm Skills Hub 和自演进机制构建多智能体协作体系。

报道显示，JiuwenSwarm 在 PinchBench 上综合得分 94.2%，相比 OpenClaw 的 91.6% 提升近 3 个百分点，平均 token 消耗降低 34.8%；在长期对话记忆 LOCOMO 上，使用 8B 模型实现 85% 记忆准确率。它还提供 HOTS（Human on the Swarm）和 HITS（Human in the Swarm）两种人类参与模式，场景覆盖昇腾算子开发、多学科医疗会诊、短视频创作、狼人杀游戏和课程辅导。

指标	数据
项目	JiuwenSwarm
社区	openJiuwen
发布时间	2026-05-18
范式	Coordination Engineering
核心组件	Agent Swarm、Swarm Skills、Swarm Skills Hub、自演进机制
PinchBench	报道称 94.2%
Token 消耗	报道称较 OpenClaw 降低 34.8%
人机协作	HOTS / HITS

量子位 · Firecat 每日 AI 资讯

CX-Mind：胸片诊断进入可验证推理阶段

上海交通大学、上海创智学院和瑞金医院联合发布 CX-Mind，面向胸片诊断中的视觉理解、报告生成和可验证推理任务。智源社区报道称，相比胸片专用模型，CX-Mind 在三大能力域上取得 25.1% 平均性能提升；单疾病识别任务相比 CheXagent 和 ChestX-Reasoner 平均提升 19.5% 和 21.0%，多病共存诊断中相应提升达到 63.5% 和 21.2%。

医疗影像 AI 的关键不只是“识别对不对”，而是能否把影像发现转化为规范、清晰、可修改、可追溯的医学语言。CX-Mind 所强调的 interleaved reasoning，更接近真实临床过程：多异常、多证据、多候选诊断同时存在时，模型要能在视觉证据、医学知识和报告表达之间来回校验。

智源社区 · 新浪科技

全球产业动态

百度萝卜快跑周订单破 35 万，自动驾驶商业化进入单城盈利口径

量子位 5 月 20 日报道，百度无人车业务披露新进展：萝卜快跑周订单突破 35 万，落地全球 27 城。报道还提到，李彦宏表示业务开始单城盈利。

这条新闻和 AI 大模型并不直接同类，但属于 AI 产业化的硬指标。自动驾驶长期处在技术演示、政策试点和资本投入阶段，订单规模、城市覆盖、单城盈利和运营效率才是商业化能否成立的关键。与大模型 Agent 类似，自动驾驶也在从“模型能力”转向“系统交付”：传感器、仿真、调度、远程运营、安全员比例、城市政策和单位经济性共同决定结果。

华盛通 / 量子位

关键数据一览

指标	数据
Qwen3.7-Max	2026-05-20 发布，API 即将上线阿里云百炼
Qwen3.7-Max 长程任务	报道称自主完成 35 小时复杂 Agent 任务
Qwen3.7-Max 工具调用	超过 1000 次工具调用
Qwen3.7-Max 内核优化	推理速度较原版本提升 10 倍
Google 月处理 Token	超 3200 万亿
Gemini App 月活	超 9 亿
Nano Banana 图片生成	累计超 500 亿张
JiuwenSwarm PinchBench	报道称 94.2%
JiuwenSwarm Token 消耗	报道称较 OpenClaw 降低 34.8%
CX-Mind	三大能力域平均提升 25.1%
萝卜快跑	周订单突破 35 万，落地全球 27 城

Sources

每日经济新闻 via 新浪财经 — Qwen3.7-Max 发布 — Qwen3.7-Max 发布时间、Arena 表现、35 小时 Agent 任务和阿里云百炼 API 信息。
搜狐 / IT之家 — 阿里千问最强智能体模型 Qwen3.7-Max 发布 — Qwen3.7-Max 发布、跨框架表现和基准补充。
IT之家 — Google 每月处理超 3200 万亿 Token — Google I/O 2026 规模数据、Gemini App 月活和 Nano Banana 图片生成量。
Google Blog — I/O 2026 — Google I/O 官方公告、Gemini Omni、Gemini 3.5 和 Agent 产品线。
量子位 — openJiuwen 发布 JiuwenSwarm — JiuwenSwarm 协同工程、多 Agent 技术体系和应用案例。
Firecat — JiuwenSwarm 每日 AI 资讯 — JiuwenSwarm benchmark、HOTS/HITS 和开源信息。
智源社区 — CX-Mind 胸片诊断 — CX-Mind 数据、医学影像推理和报告生成表现。
新浪科技 — CX-Mind — CX-Mind 中文报道补充。
华盛通 / 量子位 — 百度无人车新纪录 — 萝卜快跑周订单、城市覆盖和盈利口径。

本 Newsletter 由 AI 行业公开信息整理，数据截至 2026 年 5 月 20 日。所有信息均来自公开来源，不构成投资建议。

头条要闻​

Qwen3.7-Max 正式发布：长程 Agent 自主进化成为旗舰模型卖点​

Google AI 规模数据：月处理 Token 超 3200 万亿​

模型发布与产品更新​

JiuwenSwarm：多智能体协作从“编排”走向 Coordination Engineering​

CX-Mind：胸片诊断进入可验证推理阶段​

全球产业动态​

百度萝卜快跑周订单破 35 万，自动驾驶商业化进入单城盈利口径​

关键数据一览​

Sources​