跳到主要内容

2026-05-20 AI 动态

· 阅读需 8 分钟
本期焦点
  1. 阿里发布 Qwen3.7-Max,强调 35 小时长程智能体自主进化。
  2. Google 披露月处理超 3200 万亿 Token,Gemini App 月活超 9 亿。
  3. openJiuwen 开源 JiuwenSwarm,把多 Agent 协同工程化。
  4. CX-Mind 用可验证推理推进胸片诊断大模型。
  5. 百度萝卜快跑周订单突破 35 万,开始进入单城盈利阶段。

头条要闻

Qwen3.7-Max 正式发布:长程 Agent 自主进化成为旗舰模型卖点

5 月 20 日,阿里巴巴在 2026 阿里云峰会上发布新一代千问旗舰模型 Qwen3.7-Max。每日经济新闻报道称,Qwen3.7-Max 在第三方机构 Arena 全球大模型盲测总榜中超过 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,位列国产模型第一,并接近 GPT、Claude、Gemini 最强模型阵营。

这次发布最值得跟踪的是长程智能体能力。报道称,Qwen3.7-Max 在一个全新芯片平台上通过自主编程和超过 1000 次工具调用,实现关键内核自我进化,推理速度较原版本提升 10 倍,任务持续时间达到 35 小时。阿里云同时宣布面向 Agentic 时代升级“芯-云-模型-推理”技术体系,Qwen3.7-Max API 即将上线阿里云百炼,Qwen3.7 系列还将推出 Qwen3.7-Plus 等版本。

指标数据
模型Qwen3.7-Max
发布时间2026-05-20
发布场景2026 阿里云峰会
定位面向 Agentic 时代的新一代旗舰模型
Arena 口径报道称位列国产模型第一
长程任务报道称可自主完成 35 小时复杂 Agent 任务
工具调用超过 1000 次工具调用
内核优化推理速度较原版本提升 10 倍
API即将上线阿里云百炼

每日经济新闻 via 新浪财经 · 搜狐 / IT之家


Google AI 规模数据:月处理 Token 超 3200 万亿

IT之家 5 月 20 日报道,Google CEO Sundar Pichai 在 Google I/O 2026 开场披露,2026 年 5 月 Google 每月处理超过 3200 万亿 Token,同比增长 7 倍;Gemini App 月活超过 9 亿,同比增长超过 1 倍;每日请求量增长超过 7 倍;Nano Banana 模型累计生成超过 500 亿张图片。

这些数字比单个模型发布更能说明 AI 产业阶段变化。Google 已经把 Gemini 接入 Search、Android、Workspace、Shopping、YouTube、Chrome 和开发者平台,Token 规模不只是聊天需求增长,也来自搜索、生成、Agent、工具调用和多模态工作流的复合增长。对整个行业来说,Token 处理规模正在成为比“模型参数量”更接近真实业务负载的指标。

指标数据
Google 月处理 Token超 3200 万亿
同比增长7 倍
Gemini App 月活超 9 亿
Gemini App 同比增长超 1 倍
每日请求量同比增长超 7 倍
Nano Banana 图片生成累计超 500 亿张

IT之家 · Google Blog


模型发布与产品更新

JiuwenSwarm:多智能体协作从“编排”走向 Coordination Engineering

5 月 18 日,openJiuwen 社区发布并开源 JiuwenSwarm,5 月 20 日仍在国内开发者社区传播。该项目提出 Coordination Engineering(协同工程)范式,围绕 Agent Swarm、Swarm Skills、Swarm Skills Hub 和自演进机制构建多智能体协作体系。

报道显示,JiuwenSwarm 在 PinchBench 上综合得分 94.2%,相比 OpenClaw 的 91.6% 提升近 3 个百分点,平均 token 消耗降低 34.8%;在长期对话记忆 LOCOMO 上,使用 8B 模型实现 85% 记忆准确率。它还提供 HOTS(Human on the Swarm)和 HITS(Human in the Swarm)两种人类参与模式,场景覆盖昇腾算子开发、多学科医疗会诊、短视频创作、狼人杀游戏和课程辅导。

指标数据
项目JiuwenSwarm
社区openJiuwen
发布时间2026-05-18
范式Coordination Engineering
核心组件Agent Swarm、Swarm Skills、Swarm Skills Hub、自演进机制
PinchBench报道称 94.2%
Token 消耗报道称较 OpenClaw 降低 34.8%
人机协作HOTS / HITS

量子位 · Firecat 每日 AI 资讯


CX-Mind:胸片诊断进入可验证推理阶段

上海交通大学、上海创智学院和瑞金医院联合发布 CX-Mind,面向胸片诊断中的视觉理解、报告生成和可验证推理任务。智源社区报道称,相比胸片专用模型,CX-Mind 在三大能力域上取得 25.1% 平均性能提升;单疾病识别任务相比 CheXagent 和 ChestX-Reasoner 平均提升 19.5% 和 21.0%,多病共存诊断中相应提升达到 63.5% 和 21.2%。

医疗影像 AI 的关键不只是“识别对不对”,而是能否把影像发现转化为规范、清晰、可修改、可追溯的医学语言。CX-Mind 所强调的 interleaved reasoning,更接近真实临床过程:多异常、多证据、多候选诊断同时存在时,模型要能在视觉证据、医学知识和报告表达之间来回校验。

智源社区 · 新浪科技


全球产业动态

百度萝卜快跑周订单破 35 万,自动驾驶商业化进入单城盈利口径

量子位 5 月 20 日报道,百度无人车业务披露新进展:萝卜快跑周订单突破 35 万,落地全球 27 城。报道还提到,李彦宏表示业务开始单城盈利。

这条新闻和 AI 大模型并不直接同类,但属于 AI 产业化的硬指标。自动驾驶长期处在技术演示、政策试点和资本投入阶段,订单规模、城市覆盖、单城盈利和运营效率才是商业化能否成立的关键。与大模型 Agent 类似,自动驾驶也在从“模型能力”转向“系统交付”:传感器、仿真、调度、远程运营、安全员比例、城市政策和单位经济性共同决定结果。

华盛通 / 量子位


关键数据一览

指标数据
Qwen3.7-Max2026-05-20 发布,API 即将上线阿里云百炼
Qwen3.7-Max 长程任务报道称自主完成 35 小时复杂 Agent 任务
Qwen3.7-Max 工具调用超过 1000 次工具调用
Qwen3.7-Max 内核优化推理速度较原版本提升 10 倍
Google 月处理 Token超 3200 万亿
Gemini App 月活超 9 亿
Nano Banana 图片生成累计超 500 亿张
JiuwenSwarm PinchBench报道称 94.2%
JiuwenSwarm Token 消耗报道称较 OpenClaw 降低 34.8%
CX-Mind三大能力域平均提升 25.1%
萝卜快跑周订单突破 35 万,落地全球 27 城

Sources


本 Newsletter 由 AI 行业公开信息整理,数据截至 2026 年 5 月 20 日。所有信息均来自公开来源,不构成投资建议。