2026-05-20 AI 动态
- 阿里发布 Qwen3.7-Max,强调 35 小时长程智能体自主进化。
- Google 披露月处理超 3200 万亿 Token,Gemini App 月活超 9 亿。
- openJiuwen 开源 JiuwenSwarm,把多 Agent 协同工程化。
- CX-Mind 用可验证推理推进胸片诊断大模型。
- 百度萝卜快跑周订单突破 35 万,开始进入单城盈利阶段。
头条要闻
Qwen3.7-Max 正式发布:长程 Agent 自主进化成为旗舰模型卖点
5 月 20 日,阿里巴巴在 2026 阿里云峰会上发布新一代千问旗舰模型 Qwen3.7-Max。每日经济新闻报道称,Qwen3.7-Max 在第三方机构 Arena 全球大模型盲测总榜中超过 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,位列国产模型第一,并接近 GPT、Claude、Gemini 最强模型阵营。
这次发布最值得跟踪的是长程智能体能力。报道称,Qwen3.7-Max 在一个全新芯片平台上通过自主编程和超过 1000 次工具调用,实现关键内核自我进化,推理速度较原版本提升 10 倍,任务持续时间达到 35 小时。阿里云同时宣布面向 Agentic 时代升级“芯-云-模型-推理”技术体系,Qwen3.7-Max API 即将上线阿里云百炼,Qwen3.7 系列还将推出 Qwen3.7-Plus 等版本。
| 指标 | 数据 |
|---|---|
| 模型 | Qwen3.7-Max |
| 发布时间 | 2026-05-20 |
| 发布场景 | 2026 阿里云峰会 |
| 定位 | 面向 Agentic 时代的新一代旗舰模型 |
| Arena 口径 | 报道称位列国产模型第一 |
| 长程任务 | 报道称可自主完成 35 小时复杂 Agent 任务 |
| 工具调用 | 超过 1000 次工具调用 |
| 内核优化 | 推理速度较原版本提升 10 倍 |
| API | 即将上线阿里云百炼 |
Google AI 规模数据:月处理 Token 超 3200 万亿
IT之家 5 月 20 日报道,Google CEO Sundar Pichai 在 Google I/O 2026 开场披露,2026 年 5 月 Google 每月处理超过 3200 万亿 Token,同比增长 7 倍;Gemini App 月活超过 9 亿,同比增长超过 1 倍;每日请求量增长超过 7 倍;Nano Banana 模型累计生成超过 500 亿张图片。
这些数字比单个模型发布更能说明 AI 产业阶段变化。Google 已经把 Gemini 接入 Search、Android、Workspace、Shopping、YouTube、Chrome 和开发者平台,Token 规模不只是聊天需求增长,也来自搜索、生成、Agent、工具调用和多模态工作流的复合增长。对整个行业来说,Token 处理规模正在成为比“模型参数量”更接近真实业务负载的指标。
| 指标 | 数据 |
|---|---|
| Google 月处理 Token | 超 3200 万亿 |
| 同比增长 | 7 倍 |
| Gemini App 月活 | 超 9 亿 |
| Gemini App 同比增长 | 超 1 倍 |
| 每日请求量 | 同比增长超 7 倍 |
| Nano Banana 图片生成 | 累计超 500 亿张 |
模型发布与产品更新
JiuwenSwarm:多智能体协作从“编排”走向 Coordination Engineering
5 月 18 日,openJiuwen 社区发布并开源 JiuwenSwarm,5 月 20 日仍在国内开发者社区传播。该项目提出 Coordination Engineering(协同工程)范式,围绕 Agent Swarm、Swarm Skills、Swarm Skills Hub 和自演进机制构建多智能体协作体系。
报道显示,JiuwenSwarm 在 PinchBench 上综合得分 94.2%,相比 OpenClaw 的 91.6% 提升近 3 个百分点,平均 token 消耗降低 34.8%;在长期对话记忆 LOCOMO 上,使用 8B 模型实现 85% 记忆准确率。它还提供 HOTS(Human on the Swarm)和 HITS(Human in the Swarm)两种人类参与模式,场景覆盖昇腾算子开发、多学科医疗会诊、短视频创作、狼人杀游戏和课程辅导。
| 指标 | 数据 |
|---|---|
| 项目 | JiuwenSwarm |
| 社区 | openJiuwen |
| 发布时间 | 2026-05-18 |
| 范式 | Coordination Engineering |
| 核心组件 | Agent Swarm、Swarm Skills、Swarm Skills Hub、自演进机制 |
| PinchBench | 报道称 94.2% |
| Token 消耗 | 报道称较 OpenClaw 降低 34.8% |
| 人机协作 | HOTS / HITS |
CX-Mind:胸片诊断进入可验证推理阶段
上海交通大学、上海创智学院和瑞金医院联合发布 CX-Mind,面向胸片诊断中的视觉理解、报告生成和可验证推理任务。智源社区报道称,相比胸片专用模型,CX-Mind 在三大能力域上取得 25.1% 平均性能提升;单疾病识别任务相比 CheXagent 和 ChestX-Reasoner 平均提升 19.5% 和 21.0%,多病共存诊断中相应提升达到 63.5% 和 21.2%。
医疗影像 AI 的关键不只是“识别对不对”,而是能否把影像发现转化为规范、清晰、可修改、可追溯的医学语言。CX-Mind 所强调的 interleaved reasoning,更接近真实临床过程:多异常、多证据、多候选诊断同时存在时,模型要能在视觉证据、医学知识和报告表达之间来回校验。
全球产业动态
百度萝卜快跑周订单破 35 万,自动驾驶商业化进入单城盈利口径
量子位 5 月 20 日报道,百度无人车业务披露新进展:萝卜快跑周订单突破 35 万,落地全球 27 城。报道还提到,李彦宏表示业务开始单城盈利。
这条新闻和 AI 大模型并不直接同类,但属于 AI 产业化的硬指标。自动驾驶长期处在技术演示、政策试点和资本投入阶段,订单规模、城市覆盖、单城盈利和运营效率才是商业化能否成立的关键。与大模型 Agent 类似,自动驾驶也在从“模型能力”转向“系统交付”:传感器、仿真、调度、远程运营、安全员比例、城市政策和单位经济性共同决定结果。
关键数据一览
| 指标 | 数据 |
|---|---|
| Qwen3.7-Max | 2026-05-20 发布,API 即将上线阿里云百炼 |
| Qwen3.7-Max 长程任务 | 报道称自主完成 35 小时复杂 Agent 任务 |
| Qwen3.7-Max 工具调用 | 超过 1000 次工具调用 |
| Qwen3.7-Max 内核优化 | 推理速度较原版本提升 10 倍 |
| Google 月处理 Token | 超 3200 万亿 |
| Gemini App 月活 | 超 9 亿 |
| Nano Banana 图片生成 | 累计超 500 亿张 |
| JiuwenSwarm PinchBench | 报道称 94.2% |
| JiuwenSwarm Token 消耗 | 报道称较 OpenClaw 降低 34.8% |
| CX-Mind | 三大能力域平均提升 25.1% |
| 萝卜快跑 | 周订单突破 35 万,落地全球 27 城 |
Sources
- 每日经济新闻 via 新浪财经 — Qwen3.7-Max 发布 — Qwen3.7-Max 发布时间、Arena 表现、35 小时 Agent 任务和阿里云百炼 API 信息。
- 搜狐 / IT之家 — 阿里千问最强智能体模型 Qwen3.7-Max 发布 — Qwen3.7-Max 发布、跨框架表现和基准补充。
- IT之家 — Google 每月处理超 3200 万亿 Token — Google I/O 2026 规模数据、Gemini App 月活和 Nano Banana 图片生成量。
- Google Blog — I/O 2026 — Google I/O 官方公告、Gemini Omni、Gemini 3.5 和 Agent 产品线。
- 量子位 — openJiuwen 发布 JiuwenSwarm — JiuwenSwarm 协同工程、多 Agent 技术体系和应用案例。
- Firecat — JiuwenSwarm 每日 AI 资讯 — JiuwenSwarm benchmark、HOTS/HITS 和开源信息。
- 智源社区 — CX-Mind 胸片诊断 — CX-Mind 数据、医学影像推理和报告生成表现。
- 新浪科技 — CX-Mind — CX-Mind 中文报道补充。
- 华盛通 / 量子位 — 百度无人车新纪录 — 萝卜快跑周订单、城市覆盖和盈利口径。
本 Newsletter 由 AI 行业公开信息整理,数据截至 2026 年 5 月 20 日。所有信息均来自公开来源,不构成投资建议。