2026-05-03 AI 动态
- Gemini 支持直接生成 PDF、Word、Excel、Docs 等文件。
- OpenAI 推出 Advanced Account Security,保护 ChatGPT 与 Codex 账户。
- Anthropic 披露约 6% Claude 对话涉及个人建议,并用于训练 Opus 4.7。
- Stripe 发布 AI 经济基础设施,Link 钱包开始支持智能体支付。
- 阿里 QoderWake 将数字员工推向生产级岗位工作流。
头条要闻
Gemini 文件生成:AI 助手开始直接交付办公文件
Google 近期更新 Gemini 应用,支持用户用一句提示词直接生成可下载、可分享的文件。官方页面显示,Gemini 现在可在对话中创建 Google Docs、Sheets、Slides,以及 PDF、Microsoft Word、Excel、CSV、LaTeX、TXT、RTF、Markdown 等格式,并面向全球 Gemini app 用户开放。
这类能力和前几周国内千问表格 Agent 的方向一致:AI 助手正在从“回答一段文字”升级为“交付一个可继续编辑的工作产物”。差异在于,Gemini 选择把文件生成做成通用出口,而不是只聚焦表格。对办公场景来说,这会让用户少走一段复制、粘贴、排版和格式转换的路,也会让模型能力更自然地接入 Docs、Drive、Office 和企业知识流。
它还说明一个更大的产品趋势:下一代 AI 助手的竞争点不只是模型本身,而是能不能把结果稳定落到文件、任务、工作流和系统权限里。生成文件只是第一步,后面还会继续走向“生成并投递”“生成并协作修改”“生成并触发审批”。
模型发布与更新
OpenAI Advanced Account Security:ChatGPT 与 Codex 账户进入高安全模式
OpenAI 4 月 30 日推出 Advanced Account Security,这是 ChatGPT 账户中的一项可选安全设置,面向记者、民选官员、政治异见者、研究人员、网络安全工作者,以及其他高风险或高安全需求用户。开启后,保护会同时覆盖通过同一登录使用的 ChatGPT 和 Codex。
这项设置把多项控制集中到一个入口:要求使用 passkey 或物理安全密钥,禁用密码登录;禁用邮箱和短信恢复,改用备份 passkey、安全密钥和恢复密钥;缩短登录会话,提供登录提醒和会话管理;同时默认排除模型训练。OpenAI 还与 Yubico 合作,提供定制安全密钥组合;从 6 月 1 日起,访问 Trusted Access for Cyber 中更强网络安全模型的个人成员也需要启用该设置。
账号安全正在成为 AI 产品的基础设施问题。一个 ChatGPT 账户可能连接代码、文件、企业数据、浏览器操作和自动化任务,账户被接管的风险已经不只是“聊天记录泄露”,而是工作流、代码仓库和敏感业务上下文被接管。
| 指标 | 数据 |
|---|---|
| 产品 | Advanced Account Security |
| 发布时间 | 2026-04-30 |
| 覆盖范围 | ChatGPT 账户与同登录下的 Codex |
| 登录方式 | passkey 或物理安全密钥,禁用密码登录 |
| 恢复方式 | 备份 passkey、安全密钥、恢复密钥 |
| 训练设置 | 自动排除对话用于模型训练 |
| Trusted Access for Cyber 要求 | 2026-06-01 起个人成员需启用,或组织证明 SSO 已具备抗钓鱼认证 |
Claude 个人建议研究:约 6% 对话在问“我该怎么办”
Anthropic 4 月 30 日发布研究,使用隐私保护分析工具抽样分析 100 万条 Claude.ai 对话,发现约 6% 属于个人建议请求。研究先按唯一用户过滤得到约 63.9 万条对话,再识别出约 3.8 万条个人指导类对话,并将其分为关系、职业、个人发展、财务、法律、健康、育儿、伦理、灵性等九类。其中健康与 wellness、职业、关系、财务四类占比超过 75%。
Anthropic 特别关注“过度认同 / 迎合”问题:当用户把个人选择交给模型时,模型如果只是顺着用户情绪走,可能会放大错误判断。Anthropic 称,这项研究结果被用于 Claude Opus 4.7 和 Claude Mythos Preview 的训练,目标是提升模型在个人建议中的中立性、边界感和用户福祉保护能力。
这类研究对行业很有提示意义。通用聊天产品已经不只是生产力工具,用户会自然把职业选择、关系冲突、健康担忧和财务压力带进对话。模型是否“善解人意”之外,还要能识别高风险边界、避免无原则附和,并在需要时把用户引向专业帮助。
| 指标 | 数据 |
|---|---|
| 抽样规模 | 100 万条 Claude.ai 对话 |
| 时间范围 | 2026 年 3-4 月 |
| 唯一用户过滤后 | 约 63.9 万条对话 |
| 个人建议对话 | 约 3.8 万条,约 6% |
| 覆盖主题 | 健康、职业、关系、财务等四类超过 75% |
| 影响模型 | Claude Opus 4.7、Claude Mythos Preview |
Anthropic Research · Economic Times
DeepSeek Vision 灰测:多模态能力从技术报告走向用户侧
量子位 4 月 30 日实测 DeepSeek 识图模式,称该能力正在灰度扩大。报道显示,DeepSeek 识图模式支持思考与非思考两种路径:非思考模式响应很快,在 OCR、表格识别、网页截图转 HTML 等实用任务上表现突出;开启深度思考后,部分空间推理题可以给出正确答案,但耗时明显拉长,图片找不同等任务仍存在幻觉。
这条动态和 DeepSeek 此前发布的 Thinking with Visual Primitives 技术报告可以放在一起看。技术报告强调用点、框等视觉原语缩小视觉指代和语言推理之间的 Reference Gap;用户侧灰测则说明 DeepSeek 正在把多模态能力接入真实产品。当前能力还不稳定,但已经能看到两条路线:快模式负责 OCR、结构化、页面复原;思考模式负责空间推理和复杂图像任务。
融资与交易
Stripe Sessions 2026:288 项发布把智能体变成经济参与者
Stripe 4 月 29 日在 Sessions 2026 发布 288 项产品和功能,主题明确指向“AI 时代的经济基础设施”。官方公告和量子位授权转载均提到,Stripe 将 Agentic Commerce Suite 扩展到 Google,允许企业未来在 AI Mode 和 Gemini 应用内向消费者销售;同时推出由 Link 驱动的智能体钱包,让用户授权 AI agent 代为付款,并通过一次性虚拟卡和用户授权降低凭证泄露风险。
Stripe 还提出 Streaming Payments,用 Metronome 的精确计量和 Tempo 区块链上的稳定币微支付,为 token 消耗等 AI 原生业务模式提供实时结算。风控层面,Stripe 扩展 Radar,用于防范 AI 服务中的 token 盗用;量子位转载称,在 Stripe 上运行的 AI 服务中,每 6 次注册尝试中就有 1 次来自恶意行为,Radar 过去一个月为 8 家高增长 AI 企业拦截超过 330 万次高风险注册。
智能体真正进入商业系统,需要身份、授权、支付、额度、风控、退款、审计和微支付。Stripe 的这组发布说明,AI agent 不再只是“帮你找东西”的界面,而是开始被金融基础设施当成可授权、可计量、可结算的经济参与者。
| 日期 | 参与方 | 金额 / 数量 | 内容 |
|---|---|---|---|
| 2026-04-29 | Stripe | 288 项发布 | Sessions 2026 发布 AI 经济基础设施能力 |
| 2026-04-29 | Stripe / Google | 未披露 | Agentic Commerce Suite 将支持 AI Mode 与 Gemini 应用内销售 |
| 2026-04-29 | Stripe Link | 超 2.5 亿用户钱包基础 | 推出面向智能体授权支付的钱包能力 |
| 2026-04-29 | Stripe Radar | 超 330 万次 | 过去一个月为 8 家 AI 企业拦截高风险注册 |
Stripe · Stripe Blog · 量子位 · TechCrunch
全球产业动态
阿里 QoderWake:数字员工开始瞄准岗位级持续执行
量子位 4 月 30 日报道,阿里发布数字员工产品 QoderWake 和 Qoder 移动端。QoderWake 面向企业和个人,定位为可承担软件工程师、运营、分析师等岗位角色的生产级数字员工,目前已开启邀测。它采用 Harness-First 架构,将每次执行后的经验沉淀到记忆、技能、策略、验证规则和工作流五个维度,并通过 Anti-Rot Governance 淘汰过时经验、合并冲突、撤回失效策略。
报道提到,QoderWake 已上线“数字程序员”,可在代码更新后整理变更简报,出错时做初步诊断,遇到告警时分诊严重程度,阿里内部场景中已经用于反馈分类、日志分析、根因定位和自动生成修复代码。以单条问题根因分析为例,使用 QoderWake 后,分析耗时从 30 分钟缩短到 2 分钟。
QoderWake 的看点在于“岗位化”。很多 Agent 产品擅长完成单次任务,但企业真正需要的是在岗位上下文中长期工作、积累经验、遵守流程、接受治理。数字员工如果要进入生产环境,关键不是一次任务是否惊艳,而是能否持续稳定、可追踪、可修正。
Musk v. Altman 庭审揭开模型蒸馏暗线
Musk 起诉 OpenAI 与 Sam Altman 的庭审进入第一周,多家英文媒体持续跟进。TechCrunch 报道称,Elon Musk 4 月 30 日在加州联邦法院接受交叉询问时,被问及 xAI 是否用 OpenAI 模型对 Grok 做过蒸馏训练。Musk 先表示这是 AI 公司之间的普遍做法,随后在被追问是否意味着 xAI 也这样做时回答“Partly”。Semafor 5 月 1 日也报道了这一庭审细节。
The Verge 则整理了目前庭审披露的证据,包括早期邮件、组织文件、合约、个人通信和日记等,显示 OpenAI 早期关于非营利使命、控制权、股权、AGI 治理、商业化路径和 Microsoft 合作的分歧。这个案件的行业意义不只在 OpenAI 内部治理,也在于它把模型训练、模型蒸馏、闭源 moat、非营利使命和商业资本之间的冲突集中摆到了台前。
模型蒸馏一直是行业公开秘密之一。它能降低追赶成本,也会冲击前沿模型公司用算力和数据建立的护城河。现在相关说法出现在宣誓证词里,后续可能会影响 API 条款、反爬策略、模型输出水印、企业采购尽调和监管讨论。
TechCrunch · Semafor · The Verge
Google COSMO 泄露:I/O 前的下一代移动 AI 助手信号
Times of India 5 月 3 日报道称,Google 5 月 1 日曾短暂将未发布应用 COSMO 放上 Play Store,随后下架。页面描述称其是 Android 设备上的 experimental AI assistant application,外界猜测它可能是 Google I/O 2026 前泄露的下一代 AI 助手试验入口。
这类泄露还不能证明最终产品形态,但和 Gemini 文件生成、Gemini 车载、AI Mode 商业化等近期动态放在一起看,Google 正在把 Gemini 从单一聊天入口扩展到移动端、车机、搜索、商务、文件和系统助手。移动端 AI 的下一步不只是“换一个聊天 App”,而是把权限、通知、屏幕、文件、购物和个人上下文组合起来。
关键数据一览
| 指标 | 数据 |
|---|---|
| Gemini 文件生成支持格式 | Docs、Sheets、Slides、PDF、DOCX、XLSX、CSV、LaTeX、TXT、RTF、Markdown |
| Gemini 文件生成开放范围 | 全球 Gemini app 用户 |
| OpenAI Advanced Account Security 发布时间 | 2026-04-30 |
| OpenAI 高安全登录 | passkey 或物理安全密钥,禁用密码登录 |
| OpenAI Trusted Access for Cyber 要求 | 2026-06-01 起个人成员需启用 Advanced Account Security |
| Anthropic 抽样规模 | 100 万条 Claude.ai 对话 |
| Claude 个人建议占比 | 约 6% |
| Claude 个人建议样本 | 约 3.8 万条对话 |
| Anthropic 影响模型 | Claude Opus 4.7、Claude Mythos Preview |
| Stripe Sessions 2026 | 发布 288 项产品和功能 |
| Stripe Link 钱包 | 超 2.5 亿用户基础,新增智能体授权支付能力 |
| Stripe Radar 风控 | 过去一个月为 8 家 AI 企业拦截超 330 万次高风险注册 |
| QoderWake 数字程序员 | 单条问题根因分析从 30 分钟缩短到 2 分钟 |
| DeepSeek 识图模式 | 灰度测试中,支持思考 / 非思考模式 |
| xAI / OpenAI 蒸馏证词 | Musk 在庭审中称 xAI “partly” 使用过 OpenAI 模型蒸馏 |
Sources
- Google Blog - You can now generate files in Gemini - 支撑 Gemini 文件生成、支持格式和全球开放信息。
- TechRadar - Gemini can now generate files - 支撑 Gemini 文件生成的第三方英文报道和办公场景解读。
- OpenAI - Introducing Advanced Account Security - 支撑 ChatGPT / Codex 高安全账户设置、passkey、恢复方式和 Trusted Access for Cyber 要求。
- Anthropic Research - How people ask Claude for personal guidance - 支撑 Claude 个人建议研究、样本规模、主题分布和对 Opus 4.7 / Mythos Preview 训练的影响。
- Economic Times - Confidant Claude - 支撑 Anthropic 个人建议研究的英文媒体报道。
- 量子位 - DeepSeek 识图模式实测 - 支撑 DeepSeek Vision 灰测、思考 / 非思考模式、OCR 和空间推理表现。
- Stripe - Sessions 2026 - 支撑 Stripe 288 项发布、Google 合作、Link 智能体钱包和 AI 经济基础设施。
- Stripe Blog - Everything we announced at Sessions 2026 - 支撑 Stripe Sessions 2026 的完整产品发布清单。
- 量子位 - Stripe 发布 288 项新功能 - 支撑 Stripe 中文报道、Streaming Payments、Radar 风控和关键数据。
- TechCrunch - Stripe updates Link for AI agents - 支撑 Link 钱包面向智能体支付的第三方报道。
- 量子位 - 阿里发布 QoderWake - 支撑 QoderWake、Harness-First、Anti-Rot Governance、数字程序员和根因分析耗时数据。
- TechCrunch - Elon Musk testifies that xAI trained Grok on OpenAI models - 支撑 Musk 庭审中关于 xAI / OpenAI 模型蒸馏的证词。
- Semafor - Elon Musk admits xAI distilled OpenAI models - 支撑 xAI 蒸馏 OpenAI 模型的庭审报道。
- The Verge - All the evidence revealed so far in Musk v. Altman - 支撑 Musk v. Altman 案件证据、治理和商业化争议。
- Times of India - Google accidentally leaks COSMO - 支撑 Google COSMO 泄露和移动 AI 助手信号。
本 Newsletter 基于公开信息整理,重点覆盖 2026 年 5 月 1 日至 2026 年 5 月 3 日期间新增、更新或集中发酵的 AI 动态;所有信息均来自公开来源,不构成投资建议。