目前,全球开发者与研究人员已开始对这些模型展开测试。英伟达生态合作伙伴如Voxel51、1X、Figure AI、Foretellix、Gatik、Oxa、PlusAI和X-Humanoid等,正将Cosmos基础模型应用于自动驾驶及机器人技术项目中。
在数字领域,英伟达正升级其Nemotron工具包。该工具包的亮点包括多说话人自动语音识别模型“MultiTalker Parakeet”,以及可实现实时说话人分离的Sortformer模型。
Nemotron还推出了基于推理技术的AI安全模型,同时提供适用于强化学习和特定领域AI开发的合成数据集。
其他值得关注的更新包括Audio Flamingo 3——这是一款可对语音、音乐及各类声音进行跨模态推理的大型音频语言模型,还有Minitron-SSM——该模型能够在不损失性能的前提下对混合模型进行压缩。
英伟达研究人员还展示了Jet-Nemotron和Nemotron-Flash两款模型,它们均经过优化,可实现高效的语言模型推理并降低延迟。
通过此次发布的一系列成果,英伟达持续将开源AI推向新高度,提供的这些工具为研究人员、开发者以及自主系统创新者均赋予了强大能力。
英伟达凭借其芯片成为AI研发的核心支撑,已然跻身全球市值最高的公司之列。与此同时,该公司还设有规模庞大的软件研究部门,负责发布AI开源代码,以供Palantir Technologies等企业采用。
