跳到主要内容

2026-06-22 AI 动态

· 阅读需 5 分钟
本期焦点
  1. Gemini Interactions API 正式可用,成为 Google 模型与 Agent 的主接口。
  2. Managed Agents、后台执行和多工具组合进入稳定 API。
  3. 阿里 HappyHorse 1.1 支持 9 张角色参考图和 3 至 15 秒视频生成。
  4. OpenAI 发布 Codex-maxxing 指南,强调长程任务的上下文连续性与验证。
  5. Google DeepMind 与 A24 建立长期创作技术研究合作。

头条要闻

Gemini Interactions API:Google 把模型调用统一到 Agent 接口

Google 6 月 22 日宣布 Interactions API 正式可用,并将其设为 Gemini 模型与 Agent 的主要接口。API 使用统一端点承载模型推理和自主任务,提供服务端状态、后台执行、工具组合与多模态生成;Google AI Studio、Gemini API 和官方文档默认转向这一接口。

GA 版本加入 Managed Agents,可通过一次调用启动远程 Linux 沙箱,由默认 Antigravity Agent 或自定义 Agent 执行代码、浏览网页和管理文件。API 还支持 Google Search、Maps 与自定义函数混用,Deep Research 提供速度和深度两个版本;付费层交互记录保留 55 天,Flex 推理层可降低 50% 成本。

指标数据
状态General Availability
默认 Managed AgentAntigravity
长程任务background=True
付费层状态保留55 天
Flex 成本信号降低 50%
SDKPython、JavaScript

Google


模型发布与产品更新

HappyHorse 1.1:多角色视频生成强化一致性与音频

量子位报道,阿里发布视频生成模型 HappyHorse 1.1。新版本针对动态表现、主体一致性、指令遵循、视觉质感和音频进行升级,支持同时输入 9 张角色参考图,并增强多分镜和 N 宫格参考理解,面向短剧、电商广告、品牌营销与游戏 CG。

模型延续 3 至 15 秒生成时长、720p / 1080p 和自由宽高比,并改善动作迟缓、角色变脸、过度锐化及台词节奏等问题。版本已接入 HappyHorse 官网、阿里云百炼和千问云。

量子位

Codex-maxxing:长期 Agent 工作需要持久工作区和验证节点

OpenAI 发布《Codex-maxxing for long-running work》指南,提出把 Codex 作为持久工作区,保存跨工作流上下文,把复杂目标拆成可验证步骤,并明确哪些执行应交给 Agent、哪些节点应保留人工监督。

这类方法论比单次提示技巧更接近生产实践。长期任务的核心难题不是多生成几段代码,而是维护目标、状态、证据与回滚边界,避免 Agent 在持续执行中逐步偏离需求。

OpenAI


全球产业动态

Google DeepMind 与 A24:创作者开始进入模型研发反馈环

Google DeepMind 与电影公司 A24 宣布建立跨多个项目的长期研发合作,双方将让电影制作人直接参与新工具和工作流的测试、迭代与设计。Google 同时对 A24 进行了投资,但未披露金额。

合作没有提前承诺具体模型或成片,而是把创作者反馈放进技术研发过程。这种安排可能比单纯授权生成工具更重要:视频模型能否进入专业制作,取决于镜头控制、角色连续性、版权边界和可重复编辑,而这些要求需要制作团队持续参与。

Google


关键数据一览

指标数据
Interactions APIGemini 模型与 Agent 主接口
状态保留付费层 55 天
HappyHorse 1.19 张角色参考图、3-15 秒、720p / 1080p
Codex-maxxing持久上下文、可验证步骤、人工监督
DeepMind + A24长期研发合作,Google 投资金额未披露

Sources


本 Newsletter 由 AI 行业公开信息整理,数据截至 2026 年 6 月 22 日。所有信息均来自公开来源,不构成投资建议。