美东时间12月15日,英伟达(NVDA.US)官宣,推出NVIDIA Nemotron3系列开源模型,并提供了帮助工程师使用这些模型的数据和工具。
据介绍,Nemotron3模型分为三种规模:Nemotron3Nano是一款小型300亿参数模型,一次最多可激活30亿个参数,用于执行有针对性的、高效的任务。Nemotron3Super是一款高精度推理模型,拥有约1000亿个参数,每个令牌最多可有100亿个活动参数,适用于多智能体应用。Nemotron3Ultra是一款大型推理引擎,拥有约5000亿个参数,每个令牌最多可激活500亿个参数,适用于复杂的AI应用。
图片来源:英伟达官网
Nemotron3Nano现已上市,是目前计算成本最低的模型,针对软件调试、内容摘要、AI助手工作流程和信息检索等任务进行了优化,推理成本极低。该模型采用独特的混合MoE架构,显著提升了效率和可扩展性。与Nemotron2Nano相比,该设计实现了高达4倍的令牌吞吐量提升,并将推理令牌生成量减少了高达60%,从而显著降低了推理成本。凭借100万个令牌的上下文窗口,Nemotron3Nano能够记住更多信息,使其更加精准,并能更好地连接长时间、多步骤任务中的信息。
英伟达新发布的Nemotron3模型在可下载、修改并在自有硬件上运行的模型中表现优异,基准测试成绩领先。包括埃森哲、Cadence、CrowdStrike、Cursor、德勤、安永、Oracle云基础设施、Palantir、Perplexity、ServiceNow、西门子、Synopsys和Zoom在内的早期采用者,正在整合Nemotron系列模型,以支持制造业、网络安全、软件开发、媒体、通信和其他行业的AI工作流程。
英伟达介绍,Nemotron可在企业级AI和数据基础设施平台上使用,包括Couchbase、DataRobot、H2O(HTO.US).ai、JFrog、Lambda和UiPath(PATH.US)。对于公有云客户,Nemotron3Nano将通过Amazon Bedrock在AWS上提供,并且很快将支持Google Cloud、CoreWeave(CRWV.US)、Crusoe、Microsoft Foundry、Nebius、Nscale和Yotta。
Nemotron3Nano可作为NVIDIA NIM微服务提供,可在NVIDIA加速的基础架构上的任何位置进行安全、可扩展的部署,从而最大限度地保护隐私和控制权。Nemotron3Super和Ultra预计将于2026年上半年上市。
值得关注的是,英伟达采取了比许多美国竞争对手更透明的策略,公开了训练Nemotron所用的数据,便于工程师对模型进行修改。公司还发布了支持定制和微调的工具,包括一种新的混合潜在专家混合模型架构(hybrid latent mixture-of-experts model architecture),据称特别适合构建能够在计算机或网络上执行操作的AI代理。此外,英伟达推出了允许用户通过强化学习(reinforcement learning)训练代理执行任务的库,该方法通过模拟奖励和惩罚来训练模型。
英伟达CEO黄仁勋在发布前表示:“开放创新是AI进步的基础。通过Nemotron,我们将先进AI转变为一个开放平台正规配资平台,为开发者提供构建大规模自主系统所需的透明度和效率。”
元鼎证券_元鼎证券官网--提供最新股票市场资讯与平台功能介绍提示:本文来自互联网,不代表本网站观点。