當(dāng)前位置：首頁 > 科技 > 軟件

英偉達(dá)發(fā)布OpenReasoning-Nemotron套件：輕量級推理模型助力科研探索

來源：責(zé)編：時間：2025-07-21 08:06:56 56觀看

導(dǎo)讀英偉達(dá)近日宣布了一項(xiàng)重大進(jìn)展，推出了其全新的推理模型套件——OpenReasoning-Nemotron。這一套件內(nèi)嵌了四個精心構(gòu)建的模型，它們均基于Qwen-2.5進(jìn)行微調(diào)，參數(shù)規(guī)模覆蓋1.5B至32B不等，源頭直指擁有6710億參數(shù)的龐然大物—

英偉達(dá)近日宣布了一項(xiàng)重大進(jìn)展，推出了其全新的推理模型套件——OpenReasoning-Nemotron。這一套件內(nèi)嵌了四個精心構(gòu)建的模型，它們均基于Qwen-2.5進(jìn)行微調(diào)，參數(shù)規(guī)模覆蓋1.5B至32B不等，源頭直指擁有6710億參數(shù)的龐然大物——DeepSeek R1 0528大模型。通過“蒸餾”技術(shù)，英偉達(dá)成功實(shí)現(xiàn)了大模型的輕量化，使得這些推理模型能夠在標(biāo)準(zhǔn)游戲電腦上流暢運(yùn)行，極大地降低了部署門檻，繞開了高昂的GPU與云計算成本。

OpenReasoning-Nemotron的核心競爭力并不在于訓(xùn)練技術(shù)的突破性創(chuàng)新，而是源于其背后強(qiáng)大的數(shù)據(jù)支撐。英偉達(dá)利用NeMo Skills精心打造了500萬個涵蓋數(shù)學(xué)、科學(xué)與編程領(lǐng)域的解答數(shù)據(jù)集，通過純監(jiān)督學(xué)習(xí)的方式對模型進(jìn)行微調(diào)。經(jīng)過嚴(yán)格測試，32B模型在數(shù)學(xué)競賽AIME24中斬獲89.2分，在HMMT 2月賽中亦獲得73.8分，即便是參數(shù)最少的1.5B模型，也分別取得了55.5分和31.5分的佳績，充分展現(xiàn)了其卓越的推理與解題能力。

英偉達(dá)將OpenReasoning-Nemotron定位為科研探索的強(qiáng)大助力，四個模型的完整檢查點(diǎn)將在Hugging Face平臺開放下載，為研究人員提供了強(qiáng)化學(xué)習(xí)等進(jìn)一步實(shí)驗(yàn)的堅實(shí)基礎(chǔ)，同時也便于他們針對特定任務(wù)進(jìn)行定制優(yōu)化。該模型還支持“GenSelect模式”，即針對每個問題生成多種解答版本，通過篩選最優(yōu)解來進(jìn)一步提升準(zhǔn)確率。在這一模式下，32B模型在多項(xiàng)數(shù)學(xué)與編程基準(zhǔn)測試中，表現(xiàn)甚至超越了OpenAI的o3-high水平。

尤為英偉達(dá)在訓(xùn)練這些模型時，全程未引入強(qiáng)化學(xué)習(xí)，僅采用監(jiān)督微調(diào)的方式，為社區(qū)提供了一個干凈且技術(shù)前沿的起點(diǎn)，為未來的強(qiáng)化學(xué)習(xí)相關(guān)研究開辟了廣闊空間。對于擁有高性能游戲GPU的玩家及個人開發(fā)者而言，這套模型無疑是一個巨大的福音，使他們能夠在本地運(yùn)行接近業(yè)界最先進(jìn)水平的推理模型，極大地推動了推理技術(shù)的發(fā)展與普及。

本文鏈接：http://www.www897cc.com/showinfo-26-171575-0.html英偉達(dá)發(fā)布OpenReasoning-Nemotron套件：輕量級推理模型助力科研探索

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：大電池新潮流！萬毫安手機(jī)曝光，小米玄戒O2芯片研發(fā)加速

下一篇：再見，帶娃焦慮！鴻蒙電腦 + 早教神器，在家學(xué)得 high，在校更省心

標(biāo)簽：

熱門焦點(diǎn)

影音體驗(yàn)是真的強(qiáng) 簡單聊聊iQOO Pad

大公司的好處就是產(chǎn)品線豐富，非常細(xì)分化的東西也能給你做出來，例如早先我們看到了新的vivo Pad2，之后我們又在iQOO Neo8 Pro的發(fā)布會上看到了iQOO的首款平板產(chǎn)品iQOO Pad。雖
iPhone賣不動了！蘋果股價創(chuàng)年內(nèi)最大日跌幅：市值一夜蒸發(fā)萬億元

8月5日消息，今天凌晨美股三大指數(shù)高開低走集體收跌，道指跌0.41%；納指跌0.36%；標(biāo)普500指數(shù)跌0.52%。熱門科技股也都變化極大，其中蘋果報181.99美元，跌4.8%，創(chuàng)
量化指標(biāo)是與非：挽救被量化指標(biāo)扼殺的技術(shù)團(tuán)隊(duì)

作者 | 劉新翠整理 | 徐杰承本文整理自快狗打車技術(shù)總監(jiān)劉新翠在WOT2023大會上的主題分享，更多精彩內(nèi)容及現(xiàn)場PPT，請關(guān)注51CTO技術(shù)棧公眾號，發(fā)消息【W(wǎng)OT2023PPT】即可直接領(lǐng)取
消費(fèi)結(jié)構(gòu)調(diào)整丨巨頭低價博弈，拼多多還卷得動嗎？

來源：征探財經(jīng)作者：陳香羽隨著流量紅利的退潮，電商的存量博弈越來越明顯。曾經(jīng)主攻中高端與品質(zhì)的淘寶天貓、京東重拾“低價”口號。而過去與他們錯位競爭的拼多多，靠
大廠卷向扁平化

來源：新熵作者丨南枝編輯丨月見大廠職級不香了。俗話說，兵無常勢，水無常形，互聯(lián)網(wǎng)企業(yè)調(diào)整職級體系并不稀奇。7月13日，淘寶天貓集團(tuán)啟動了近年來最大的人力制度改革，目前已形成一
東方甄選單飛：有些鳥注定是關(guān)不住的

文/彭寬鴻編輯/羅卿東方甄選創(chuàng)始人俞敏洪帶隊(duì)的“7天甘肅行”直播活動已在近日順利收官。成立后一年多時間里，東方甄選要脫離抖音自立門戶的傳聞不絕于耳，“7
年輕人的“職場羞恥感”，無處不在

作者：馮曉亭陶淘李欣張琳馬舒葉來源：燃次元“人在職場，應(yīng)該選擇什么樣的著裝？”近日，在網(wǎng)絡(luò)上，一個與著裝相關(guān)的帖子引發(fā)關(guān)注，在該帖子里，一位在高級寫字樓亞洲金
華為開發(fā)者大會2023日程公開：開設(shè)鴻蒙HarmonyOS 4體驗(yàn)區(qū)

IT之家 7 月 31 日消息，華為今日公布了 HDC.Together 開發(fā)者大會 2023 的詳細(xì)日程。整場大會將于 8 月 4 日-6 日之間舉行，屆時將發(fā)布最新一代鴻蒙 H
2納米決戰(zhàn)2025

集微網(wǎng)報道從三強(qiáng)爭霸到四雄逐鹿，2nm的廝殺聲已然隱約傳來。無論是老牌勁旅臺積電、三星，還是誓言重回先進(jìn)制程領(lǐng)先地位的英特爾，甚至初成立不久的新

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

英偉達(dá)發(fā)布OpenReasoning-Nemotron套件：輕量級推理模型助力科研探索

影音體驗(yàn)是真的強(qiáng) 簡單聊聊iQOO Pad

iPhone賣不動了！蘋果股價創(chuàng)年內(nèi)最大日跌幅：市值一夜蒸發(fā)萬億元

量化指標(biāo)是與非：挽救被量化指標(biāo)扼殺的技術(shù)團(tuán)隊(duì)

消費(fèi)結(jié)構(gòu)調(diào)整丨巨頭低價博弈，拼多多還卷得動嗎？

大廠卷向扁平化

東方甄選單飛：有些鳥注定是關(guān)不住的

年輕人的“職場羞恥感”，無處不在

華為開發(fā)者大會2023日程公開：開設(shè)鴻蒙HarmonyOS 4體驗(yàn)區(qū)

2納米決戰(zhàn)2025

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊