NVIDIA发布Cosmos 3:全球首个全开源物理AI全能模型面世
时间:2026-06-05 | 作者: | 阅读:0快科技6月4日消息,据媒体报道,英伟达在台北举办的GTC活动上正式发布Cosmos 3,并将其称为全球首个“完全开放的全能模型”。
该模型面向机器人、自动驾驶汽车及视觉智能体,主打基于视觉的推理能力,同时可生成文本、图像、视频、环境声音和动作等多模态内容。
据英伟达介绍,Cosmos 3采用由推理Transformer与生成Transformer组成的双模块架构。其中,推理Transformer负责理解物体交互、运动轨迹及时空关系,生成Transformer则在此基础上输出视频内容与动作轨迹。
这一设计使模型能够先理解现实世界中的物理互动,再生成对应的画面和行为结果,从而显著提升对复杂环境的建模能力。
英伟达指出,Cosmos 3主要致力于解决机器人、自动驾驶车辆和视觉智能体在真实环境理解方面长期面临的难题。
当前,相关训练数据仍然有限,仿真系统也较为分散,导致机器在学习物理世界规律时面临较高门槛。Cosmos 3的目标是以更高的物理准确性,原生理解并生成文本、图像、视频、环境声音及动作信息。
从应用定位来看,英伟达表示,Cosmos 3既可作为视觉语言模型使用,也可作为模拟物理环境、预测未来世界状态的世界模型,还可作为其他世界模型的基础平台。
在产品规划方面,响应精度最高的Cosmos 3 Super与轻量版本Cosmos 3 Nano已正式可用,面向边缘设备实时推理的Cosmos 3 Edge将于后续推出。
在技术层面,Transformer是一类擅长处理序列数据中上下文关系的深度学习神经网络,可通过并行计算提升生成效率。英伟达此次将推理与生成能力相结合,旨在为机器人与自动驾驶系统提供更接近真实物理世界的基础模型能力。
来源:https://news.pconline.com.cn/2166/21663411.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 三大AI模型同台竞技京沪高考作文题 文心一言表现获评最佳
- 时间:2026-06-07
-
- 微星发布27英寸QD-Mini LED显示器MAG 276QRM32 支持2K 320Hz高刷与广色域
- 时间:2026-06-07
-
- 互联网历史上首次!机器人流量首度超越人类:占比57.5%
- 时间:2026-06-07
-
- 全球首个预制算力中心底座投用 Token用电成本大降30%
- 时间:2026-06-07
-
- 华硕破晓7 Pro笔记本正式开售 搭载锐龙AI处理器 起售价7999元。
- 时间:2026-06-07
-
- OpenAI芯片项目核心成员转投Anthropic AI巨头间人才流动持续引发关注。
- 时间:2026-06-07
-
- 苹果iOS 27将重点升级Siri为系统级聊天机器人 但初期或为测试版并限制访问
- 时间:2026-06-07
-
- 泰坦军团发布新款31.5英寸曲面显示器 支持2K分辨率与275Hz高刷新率
- 时间:2026-06-07
精选合集
更多大家都在玩
大家都在看
更多-
- AutoCAD 2007面域工具使用教程与操作详解
- 时间:2026-06-07
-
- AutoCAD 2007环形阵列功能使用教程详解
- 时间:2026-06-07
-
- 受欢迎的跳跃游戏合集
- 时间:2026-06-07
-
- nero光盘刻录软件使用教程详解
- 时间:2026-06-07
-
- foobar2000中文界面设置详细教程
- 时间:2026-06-07
-
- 知网百科知识查询与学术检索官网入口指南
- 时间:2026-06-07
-
- 雷电模拟器退出时最小化到托盘设置方法
- 时间:2026-06-07
-
- 雷电模拟器4核CPU性能优化设置教程
- 时间:2026-06-07