跳到主要内容

2026-04-29 AI 动态

· 阅读需 12 分钟
本期焦点
  1. NVIDIA 推出 Nemotron 3 Nano Omni,面向端侧实时语音 AI。
  2. 腾讯混元 Hy3 preview 在数字中国建设峰会首秀 3D 世界生成。
  3. 工信部与国家数据局启动“模数共振”行动,覆盖 20 个制造重点行业。
  4. 具身智能公司无界动力完成数千万元天使+轮融资。
  5. Meta 签下 791MW 太阳能与长期储能协议,为 AI 数据中心补能源。

头条要闻

Nemotron 3 Nano Omni:NVIDIA 把实时语音 AI 推向端侧设备

4 月 28 日,NVIDIA 发布 Nemotron 3 Nano Omni,定位为轻量级实时语音理解模型。该模型面向机器人、车载系统和物联网设备,支持语音到文本、语音转写、语音翻译、多语种对话、情绪识别、语音活动检测等任务。IT之家报道,Nemotron 3 Nano Omni 采用 Mamba-2 与 Transformer 混合架构,可同时处理 6 种音频任务,并支持英语、西班牙语、法语、德语、意大利语、葡萄牙语、荷兰语和中文等语言。

这条更新的重点不是“又一个语音转文字模型”,而是多任务语音 AI 正在从云端接口走向边缘设备。NVIDIA 称该模型在 Jetson AGX Thor 上的 Real-Time Factor 约为 0.025,意味着可以在低延迟环境中运行;报道也提到,其推理速度约为 parakeet-tdt-0.6b-v2 的 9 倍。机器人、车机和可穿戴设备需要持续听懂人、环境和情绪,端侧实时语音模型会成为物理 AI 的基础感知层。

NVIDIA · IT之家


模型发布与更新

腾讯混元 Hy3 preview:从单物体生成走向 3D 世界建模

4 月 29 日,腾讯混元 Hy3 preview 在第八届数字中国建设峰会现场首秀。IT之家报道,Hy3 preview 可通过提示词生成建筑、街区、科幻场景等完整 3D 世界;它不只生成单个 3D 物体,而是将空间布局、物体关系、材质、光照和风格统一组织成可观察的 3D 场景。现场展示中,用户输入“阳光明媚的未来科技城市,干净的街道,高耸的玻璃建筑,飞行汽车在空中穿梭”,模型即可生成带道路、建筑、植物和空中交通的 3D 场景。

这说明 3D 生成正在从“资产生成”向“空间生成”演进。游戏、数字孪生、影视预演、建筑设计和机器人仿真都需要完整场景而非孤立模型。对腾讯来说,Hy3 preview 也与混元 3D、游戏引擎、云渲染和元宇宙资产管线形成更清晰的连接点。

指标数据
模型腾讯混元 Hy3 preview
展示时间2026-04-29
展示场景第八届数字中国建设峰会
输入自然语言提示词
输出建筑、街区、科幻城市等 3D 世界
重点能力空间布局、物体关系、材质、光照和整体风格生成

IT之家


Google / Kaggle GenAI Intensive:开发者课程转向 Vibe Coding 与 Agent

Google 4 月 29 日宣布与 Kaggle 推出新一期 GenAI Intensive Course,主题转向 “Vibe Coding”。课程将于 6 月 9 日至 13 日举行,面向希望用生成式 AI 提高软件开发效率的开发者,内容覆盖上下文工程、生产级 AI Agent、提示模式、自动化工作流、评估与优化等方向。

这类课程信号很实际:模型公司和平台方正在把“如何和 AI 一起写代码”做成标准化开发者教育。Coding Agent 不再只是 IDE 里的按钮,也需要上下文组织、任务拆解、评估、回滚、测试和安全实践。对企业团队来说,Vibe Coding 真正进入生产环境之前,工程规范和评估方法会比单次生成效果更重要。

Google Blog


融资与交易

无界动力完成数千万元天使+轮融资,押注机器人“本体智能化”

36氪 4 月 27 日报道,具身智能公司无界动力完成数千万元天使+轮融资,投资方包括藕舫天使、泓峪投资等,资金将主要用于产品研发、供应链建设和市场拓展。公司成立于 2025 年 3 月,方向是“本体智能化”,也就是围绕机器人的结构、运动控制、感知和执行能力做系统级优化,而不是只做上层大模型调用。

具身智能融资在过去一年明显升温,但真正进入交付阶段时,难点会落到更细的工程环节:关节可靠性、功耗、传感器融合、运动规划、数据闭环、量产供应链和成本控制。无界动力这类公司强调“本体”,说明资本也在重新审视:机器人智能不是只把大模型接上去,还要让硬件身体足够稳定、可控、可规模化。

日期公司金额内容
2026-04-27无界动力数千万元人民币完成天使+轮融资,资金用于研发、供应链和市场拓展

36氪


Meta 签下太阳能与长期储能协议,为 AI 数据中心补电力底座

Meta 4 月 29 日宣布两项能源合作:与 ENGIE North America 签署 Environmental Attributes Purchase Agreement,支持得州 Swenson Ranch 太阳能项目;项目装机容量为 600MW,预计 2027 年投运。同时,Meta 与 XGS Energy 签署协议,将在新墨西哥州 PNM 电网部署 150MW 下一代地热能源,预计 2030 年投运。此前 Meta 还宣布与 Pivot Energy 达成 91MW 太阳能合作,用于支持 AI 创新和社区电力需求。

这些交易把 AI 基础设施的竞争拉回到最底层:电力和并网。大模型训练、推理、视频生成、3D 世界生成和 Agent 工作流都会把数据中心负载推高,算力公司必须同时解决 GPU、网络、冷却、供电和长期能源价格。Meta 把太阳能、地热和长期储能打包推进,说明 AI 数据中心已经不只是云计算问题,也是能源项目组合问题。

日期参与方规模内容
2026-04-29Meta / ENGIE North America600MW支持得州 Swenson Ranch 太阳能项目
2026-04-29Meta / XGS Energy150MW在新墨西哥州部署下一代地热能源
2026-04-28Meta / Pivot Energy91MW支持伊利诺伊州与密歇根州太阳能项目

Meta


全球产业动态

“模数共振”行动启动:制造业 AI 落地从试点走向行业清单

4 月 28 日,工信部办公厅、国家数据局综合司联合印发通知,启动 2026 年“人工智能产业及赋能新型工业化”项目遴选工作。IT之家报道,本次“模数共振”行动聚焦人工智能技术与工业数据深度融合,面向制造业 20 个重点行业征集典型案例,包括原材料、装备制造、消费品、电子信息制造、民爆、先进制造等方向。

政策语言里的“模数共振”很值得注意:模型能力如果不能吃到高质量工业数据,就很难进入真实产线;工业数据如果没有模型承接,也很难转化成自动化决策和生产效率。行动按行业征集典型案例,意味着制造业 AI 落地会从泛泛的“大模型赋能”进入更明确的场景清单:工艺优化、缺陷检测、设备运维、排产调度、质量追溯和供应链协同。

工信部 · IT之家


Meta Llama 版权案新披露:数据来源争议继续影响开源模型叙事

The Verge 4 月 28 日报道,Meta 在 Llama 相关版权诉讼中继续面临数据来源争议。报道援引法庭材料称,Meta 员工曾讨论过从 Library Genesis 等影子图书馆获取数据,并涉及对 torrent 下载和数据处理方式的内部讨论。案件仍在推进中,关键问题是训练数据获取和使用是否构成合理使用,以及模型公司在数据来源上应承担怎样的披露和治理责任。

这条线索会持续影响开源模型生态。开源权重降低了使用门槛,但训练数据的合法性、来源记录、去重、授权和退出机制,正在变成模型能否被企业和公共部门放心采用的合规前提。未来模型卡和数据说明可能会从“加分项”变成采购审查的一部分。

The Verge


AI 眼镜继续被大厂盯上:苹果传出产品时间表

IT之家 4 月 29 日援引报道称,苹果计划在 2026 年底前量产用于竞品对标 Meta Ray-Ban 的智能眼镜,并预计 2027 年发布;产品预计搭载摄像头、麦克风、扬声器和 AI 功能,支持拍照录像、环境识别、音乐播放、通话和导航等能力。

这类传闻需要谨慎看待,但它反映的方向很清楚:AI 硬件竞争正在从手机 App 和桌面助手,延伸到始终在线的轻量可穿戴设备。眼镜形态的优势是视角连续、语音自然、摄像头可感知环境;难点则是隐私提示、续航、重量、场景误触发和内容生态。如果苹果、Meta、Google 等公司继续推动这一形态,端侧多模态模型和隐私计算会变得更关键。

IT之家


关键数据一览

指标数据
Nemotron 3 Nano Omni支持 6 类音频任务,覆盖 8 种语言
Nemotron 3 Nano Omni 端侧性能NVIDIA 称 Jetson AGX Thor 上 RTF 约 0.025
Nemotron 3 Nano Omni 速度报道称约为 parakeet-tdt-0.6b-v2 的 9 倍
腾讯混元 Hy3 preview2026-04-29 在数字中国建设峰会首秀
Hy3 preview 输出由文本生成建筑、街区、科幻城市等 3D 世界
无界动力融资数千万元人民币天使+轮
Meta / ENGIE600MW 太阳能项目,预计 2027 年投运
Meta / XGS Energy150MW 地热能源,预计 2030 年投运
Meta / Pivot Energy91MW 太阳能合作
“模数共振”行动面向制造业 20 个重点行业征集典型案例
Kaggle GenAI Intensive2026-06-09 至 2026-06-13,主题为 Vibe Coding
苹果 AI 眼镜传闻报道称 2026 年底前量产,2027 年发布

Sources


本 Newsletter 基于公开信息整理,重点覆盖 2026 年 4 月 27 日至 2026 年 4 月 29 日期间新增、更新或集中发酵的 AI 动态;所有信息均来自公开来源,不构成投资建议。