2026-06-07 AI 动态2026年6月7日 · 阅读需 3 分钟本期焦点 开源社区围绕 OpenEnv 推进 Agentic RL,强调可复现环境和工具调用训练。 Holo3.1、hf CLI 和 GLM Coding Plan 等线索显示 Agent 训练与执行环境正在合流。 Agentic RL 的核心不只是奖励函数,而是任务环境、工具接口和验证器能否稳定复现。 周末主线从单个模型发布转向 Agent 训练基础设施。