跳到主要内容

2026-06-11 AI 动态

· 阅读需 4 分钟
本期焦点
  1. Anthropic 推出 Claude Corps,投入 1.5 亿美元培训 1000 名 fellows 服务 400+ 非营利组织。
  2. OpenAI 展示 Codex 辅助黑洞模拟,AI 编程工具进入高性能科学计算流程。
  3. Anthropic 同步把 AI 带来的劳动冲击纳入政策框架和社会投入。
  4. Claude Fable 5 护栏透明度争议提醒:最高能力模型发布需要可见的降级和拒答机制。

2026-06-10 AI 动态

· 阅读需 3 分钟
本期焦点
  1. OpenAI 与 Oracle 合作,OCI 客户可用既有云承诺访问 OpenAI 模型和 Codex。
  2. Google 发布 DiffusionGemma,26B MoE 文本扩散模型最高 4 倍更快生成。
  3. Gemini 面向小企业接入 Google Business Profile 和 Business notebooks。
  4. 企业 AI 竞争继续围绕采购路径、低延迟模型和业务上下文整合展开。

2026-06-09 AI 动态

· 阅读需 4 分钟
本期焦点
  1. Anthropic 发布 Claude Fable 5 和 Claude Mythos 5,最高能力模型分为公共版与可信访问版。
  2. Cohere 发布 North Mini Code,30B MoE 编码模型开放 Apache 2.0 权重。
  3. Google 发布 Gemini 3.5 Live Translate,支持 70 多种语言近实时语音到语音翻译。
  4. Google Co-Scientist 展示多 Agent 科学假设生成、辩论和演化流程。

2026-06-08 AI 动态

· 阅读需 3 分钟
本期焦点
  1. OpenAI 保密提交 S-1,前沿模型公司进入 IPO 准备阶段。
  2. OpenAI 发布 broad benefit plan,把公司治理与“广泛受益”叙事绑定。
  3. OpenAI Economic Research Exchange 启动,面向 AI 对工作、企业和经济影响的外部研究。
  4. 模型竞争正在同时进入资本市场、公共治理和经济测量阶段。

2026-06-07 AI 动态

· 阅读需 3 分钟
本期焦点
  1. 开源社区围绕 OpenEnv 推进 Agentic RL,强调可复现环境和工具调用训练。
  2. Holo3.1、hf CLI 和 GLM Coding Plan 等线索显示 Agent 训练与执行环境正在合流。
  3. Agentic RL 的核心不只是奖励函数,而是任务环境、工具接口和验证器能否稳定复现。
  4. 周末主线从单个模型发布转向 Agent 训练基础设施。

2026-06-06 AI 动态

· 阅读需 3 分钟
本期焦点
  1. Agent Planning Benchmark 提出 4209 个多模态规划案例,专门诊断 Agent 规划能力。
  2. APB 将失败拆到规划阶段,而不是只看端到端执行是否成功。
  3. 评测覆盖 22 个领域和 5 类设置,强调工具噪声、坏工具、不可解任务和拒答校准。
  4. 随着 Agent 进入生产环境,规划诊断会成为执行评测的重要前置环节。

2026-06-05 AI 动态

· 阅读需 3 分钟
本期焦点
  1. Google 发布 5 月 AI 更新汇总,把 I/O 2026 主线明确为 agentic Gemini era。
  2. Gemini 3.5 被定位为面向 Agent 和 coding 的 frontier intelligence。
  3. Gemini Omni、Universal Cart、Google Health 和硬件入口说明 AI 正进入日常任务流。
  4. Google 的路线不是单点模型发布,而是搜索、购物、健康、硬件和开发工具的系统整合。

2026-06-04 AI 动态

· 阅读需 3 分钟
本期焦点
  1. OpenAI 推出更可扩展的 ChatGPT memory dreaming 架构,改善长期上下文的新鲜度和相关性。
  2. Hugging Face 重新设计 hf CLI,使其更适合 Agent 访问 Hub、模型、数据集和作业。
  3. NVIDIA 在 Hugging Face 发布 Nemotron 3.5 Content Safety,强调可定制多模态安全。
  4. 记忆、CLI 和安全模型说明 Agent 基础设施正在补齐“长期运行”的底层能力。

2026-06-03 AI 动态

· 阅读需 4 分钟
本期焦点
  1. OpenAI 更新 GPT-Rosalind,把 GPT-5.5 的 Agent 编码和工具调用能力带入生命科学。
  2. Anthropic 基于 832 个恶意网络账号映射 AI-enabled cyber threats,指出攻击正在更自主。
  3. Claude Partner Network 推出 Services Track 和 Partner Hub,企业 AI 交付开始标准化。
  4. 生命科学、网络安全和咨询交付同时说明:Agent 正在进入高专业门槛行业。

2026-06-02 AI 动态

· 阅读需 4 分钟
本期焦点
  1. OpenAI 发布 Codex 角色插件、Sites 和 annotations,Codex 从编程工具扩展到多岗位工作流。
  2. Anthropic 扩大 Project Glasswing,将 Claude Mythos Preview 提供给约 150 个新组织。
  3. Holo3.1 展示本地 Computer Use Agent 路线,端侧执行环境继续升温。
  4. 智谱 GLM Coding Plan 团队版上线,国内编码 Agent 开始补企业订阅与权限管理。