當(dāng)前位置：首頁 > 元宇宙 > AI

小紅書首推大模型dots.llm1，中文性能力壓DeepSeek-V3

來源：責(zé)編：時(shí)間：2025-06-11 10:03:37 49觀看

導(dǎo)讀近日，國內(nèi)社交內(nèi)容平臺(tái)小紅書在人工智能領(lǐng)域邁出了重要一步，宣布開源其首個(gè)大型語言模型dots.llm1。這一舉動(dòng)不僅為開源社區(qū)增添了一名重量級的新成員，也彰顯了小紅書在技術(shù)創(chuàng)新上的雄厚實(shí)力。dots.llm1是一個(gè)擁有1420億

近日，國內(nèi)社交內(nèi)容平臺(tái)小紅書在人工智能領(lǐng)域邁出了重要一步，宣布開源其首個(gè)大型語言模型dots.llm1。這一舉動(dòng)不僅為開源社區(qū)增添了一名重量級的新成員，也彰顯了小紅書在技術(shù)創(chuàng)新上的雄厚實(shí)力。

dots.llm1是一個(gè)擁有1420億參數(shù)的混合專家（MoE）模型，但在實(shí)際應(yīng)用中，它僅需激活140億參數(shù)，便能展現(xiàn)出與阿里Qwen3-32B模型相近的性能。這一特性使得dots.llm1在保持高效能的同時(shí)，也大大降低了運(yùn)算成本。在中文任務(wù)上的表現(xiàn)尤為亮眼，dots.llm1在C-eval評測中取得了92.2分的高分，超越了包括DeepSeek-V3在內(nèi)的眾多模型。

技術(shù)報(bào)告顯示，小紅書團(tuán)隊(duì)在數(shù)據(jù)處理方面做出了多項(xiàng)創(chuàng)新。他們提出了一個(gè)可擴(kuò)展且細(xì)粒度的三階段數(shù)據(jù)處理框架，旨在提升數(shù)據(jù)的規(guī)模、質(zhì)量和多樣性。團(tuán)隊(duì)還開發(fā)了Web雜亂清除模型和類別平衡技術(shù)，進(jìn)一步確保了數(shù)據(jù)的高質(zhì)量和多樣性。這些努力使得dots.llm1在預(yù)訓(xùn)練階段就能接觸到豐富且高質(zhì)量的數(shù)據(jù)，從而提升了模型的性能。

在模型架構(gòu)方面，dots.llm1采用了僅限解碼器的Transformer架構(gòu)，其中每一層包含一個(gè)注意力層和一個(gè)前饋網(wǎng)絡(luò)（FFN）。與傳統(tǒng)的密集模型不同，dots.llm1的FFN被專家混合（MoE）層所替代。這種架構(gòu)使得dots.llm1能夠在保持經(jīng)濟(jì)成本的同時(shí)，訓(xùn)練出功能強(qiáng)大的模型。在注意力層方面，dots.llm1使用了普通的多頭注意力機(jī)制，而在MoE層則遵循了DeepSeek和Qwen的做法，用包含共享和獨(dú)立專家的MoE層替換了FFN。

為了全面評估dots.llm1的性能，小紅書團(tuán)隊(duì)在中文和英文上進(jìn)行了預(yù)訓(xùn)練，并評估了它在多個(gè)領(lǐng)域基準(zhǔn)測試中的表現(xiàn)。結(jié)果顯示，dots.llm1在大多數(shù)領(lǐng)域中表現(xiàn)出了與Qwen2.5-72B相當(dāng)?shù)男阅堋Ｌ貏e是在語言理解任務(wù)上，dots.llm1在中文理解基準(zhǔn)測試中取得了較高性能，這主要得益于其高效的數(shù)據(jù)處理管道。在知識(shí)任務(wù)、代碼和數(shù)學(xué)領(lǐng)域，dots.llm1也展現(xiàn)出了穩(wěn)健的表現(xiàn)。

dots.llm1在預(yù)訓(xùn)練完成后還經(jīng)過了監(jiān)督微調(diào)階段。小紅書團(tuán)隊(duì)基于開源數(shù)據(jù)和內(nèi)部注釋數(shù)據(jù)收集了大約400k個(gè)指令調(diào)優(yōu)實(shí)例，并對dots.llm1進(jìn)行了兩個(gè)階段的微調(diào)。這些努力進(jìn)一步提升了dots.llm1在特定領(lǐng)域（如數(shù)學(xué)和編碼）的能力。

通過此次開源，小紅書不僅為人工智能領(lǐng)域貢獻(xiàn)了一個(gè)強(qiáng)大的大型語言模型，也展示了其在數(shù)據(jù)處理和模型架構(gòu)方面的創(chuàng)新實(shí)力。dots.llm1的成功推出，無疑將推動(dòng)大型語言模型的發(fā)展和應(yīng)用，為人工智能技術(shù)的進(jìn)步注入新的活力。

舉報(bào) 0收藏 0打賞 0評論 0

更多>同類資訊

具身智能未來何在？行業(yè)大佬激辯：機(jī)器人“能干活”方顯真功夫

06-10

商湯小浣熊與螞蟻百寶箱聯(lián)手，打造AI數(shù)據(jù)分析助手賦能商家

06-10

字節(jié)AI整合發(fā)力，"可靈們"能否守住市場一席之地？

其AI社交產(chǎn)品“貓箱”與同類產(chǎn)品“星野”之間難分伯仲，AI視頻產(chǎn)品“即夢”與快手旗下“可靈”在內(nèi)容創(chuàng)作和商業(yè)生態(tài)上走向分野，即便是用戶數(shù)據(jù)表現(xiàn)最突出的“豆包”，也被DeepSeek、騰訊元寶、KIMI幾大強(qiáng)…

06-10

愛簿智能E300模組：50TOPS國產(chǎn)算力，驅(qū)動(dòng)邊緣AI全場景部署新紀(jì)元

06-10

美圖：AI時(shí)代中廠的逆襲之路？

華泰證券2025年5月的一份研報(bào)提到，美圖旗下美顏相機(jī)海外版通過“AI換裝”功能，在東南亞迅猛拉新，MAU較推出相應(yīng)功能前有階梯式上升表現(xiàn)，提升約36%，說明單點(diǎn)AI爆款功能能夠吸引用戶流向復(fù)用性更高的其他功…

06-10

字節(jié)AI整合發(fā)力，"可靈"等競品能否抵擋字節(jié)攻勢？

06-10

蘋果AI進(jìn)程緩慢，庫克堅(jiān)持混動(dòng)路線能否跟上AI時(shí)代步伐？

06-10

《2025年云安全報(bào)告》出爐：企業(yè)云安全漏洞頻發(fā)，如何應(yīng)對成難題

06-10

MiTAC神雲(yún)科技ISC2025大展拳腳：先進(jìn)服務(wù)器平臺(tái)引領(lǐng)HPC未來

06-10

vivo Y400 Pro即將登陸印度：天璣7300+90W快充，配置搶先看！

06-10

直播電商監(jiān)管新規(guī)：黑名單制度出爐，營銷人員信息留存至少三年

第二十四條直播間運(yùn)營者應(yīng)當(dāng)依據(jù)法律、法規(guī)對直播商品或服務(wù)進(jìn)行準(zhǔn)入把關(guān)，審核查驗(yàn)實(shí)際銷售商品或者提供服務(wù)的平臺(tái)內(nèi)經(jīng)營者的名稱（姓名）、統(tǒng)一社會(huì)信用代碼（身份證件號碼）、住所或者主要經(jīng)營場所、聯(lián)系方式、行政許…

06-10

淘寶摘得蘋果設(shè)計(jì)大獎(jiǎng)，成國內(nèi)互聯(lián)網(wǎng)平臺(tái)首例！

北京時(shí)間6月10日凌晨，淘寶在蘋果開發(fā)者大會(huì)（WWDC）上榮獲蘋果設(shè)計(jì)大獎(jiǎng)，成為該獎(jiǎng)項(xiàng)設(shè)立28年來首個(gè)獲獎(jiǎng)的國內(nèi)互聯(lián)網(wǎng)平臺(tái)。淘寶憑借其在AppleVision Pro上發(fā)布的“淘寶Vision”應(yīng)用獲獎(jiǎng)，該…

06-10

FUDOKI模型：革新多模態(tài)生成，讓AI理解與創(chuàng)造更靈活高效

06-10

亞馬遜豪擲200億美元，賓州AI基建再添重磅投資！

06-10

TTD推出Deal Desk，革新數(shù)字廣告交易管理新篇章

06-10

點(diǎn)擊查看更多 +

全站最新

一汽豐田bZ5上市，續(xù)航550-630km，售價(jià)12.98-15.98萬元，性價(jià)比高嗎？

2026款沃爾沃XC40煥新上市，26.98萬起售，能否逆襲凱迪拉克XT4？

光谷創(chuàng)業(yè)咖啡孵化項(xiàng)目“車來了”成功上市，天使投資模式再添輝煌篇章！

問界全系重慶車展大放異彩，M9交付里程碑：20萬輛達(dá)成！

混動(dòng)車涉水全攻略：安全通過不慌張，事后三檢保無憂

江淮華為聯(lián)手打造的尊界S800，72小時(shí)大定破2600，開啟中國品牌高端化新征途

熱門內(nèi)容

榮耀“鯤鵬”照片事件真相大白，造謠者道歉遭刑拘
騰訊阿里AI to C戰(zhàn)場“雙吳”爭霸，誰將問鼎AI搜索之巔？
英偉達(dá)全球總部或?qū)⒙鋺糁袊_(tái)灣，黃仁勛下周宣布這一重大決定？
教育部新規(guī)：學(xué)生禁直接復(fù)制AI作業(yè)，強(qiáng)化獨(dú)立思考與批判性思維
聯(lián)發(fā)科天璣9400e發(fā)布：天璣9300+升級版，藍(lán)牙升級至6.0
中國知網(wǎng)CNKI AI：重塑知識(shí)服務(wù)新生態(tài)，四大核心力引領(lǐng)未來
中國GPU市場競爭激烈，英偉達(dá)獨(dú)占7成，華為昇騰緊追其后！
華為Mate 40系列（5G）已支持5G-A網(wǎng)絡(luò)，性能再升級！
華為nova 14系列震撼登場！鴻蒙5直板機(jī)領(lǐng)銜，nova 14僅售2699元起
教育部新規(guī)：中小學(xué)分階段用AI，嚴(yán)禁復(fù)制答案強(qiáng)化獨(dú)立思考
華為nova14 Ultra震撼登場！鴻蒙5系統(tǒng)加持，售價(jià)4199元起
華為昇騰超節(jié)點(diǎn)技術(shù)突破：384卡高速互聯(lián)，引領(lǐng)AI模型訓(xùn)練新紀(jì)元
華為nova 15系列下半年將亮相，自研芯片加持產(chǎn)品力再升級？
DeepSeek新論文揭秘：梁文鋒領(lǐng)銜探索AI訓(xùn)練推理成本效益之道
榮耀400系列新品發(fā)布會(huì)：4K超清Live拼圖，定格每個(gè)精彩瞬間？

本欄最新

商湯小浣熊與螞蟻百寶箱聯(lián)手，打造AI數(shù)據(jù)分析助手賦能商家

字節(jié)AI整合發(fā)力，"可靈們"能否守住市場一席之地？

美圖：AI時(shí)代中廠的逆襲之路？

字節(jié)AI整合發(fā)力，"可靈"等競品能否抵擋字節(jié)攻勢？

蘋果AI進(jìn)程緩慢，庫克堅(jiān)持混動(dòng)路線能否跟上AI時(shí)代步伐？

MiTAC神雲(yún)科技ISC2025大展拳腳：先進(jìn)服務(wù)器平臺(tái)引領(lǐng)HPC未來

本文鏈接：http://www.www897cc.com/showinfo-45-13632-0.html小紅書首推大模型dots.llm1，中文性能力壓DeepSeek-V3

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：黃仁勛：AI成平等推進(jìn)器，人類語言成新編程“鑰匙”

下一篇：具身智能未來何在？行業(yè)大佬激辯：機(jī)器人“能干活”方顯真功夫

標(biāo)簽：

熱門焦點(diǎn)

不同于傳統(tǒng)數(shù)字經(jīng)濟(jì)，元宇宙賦予商業(yè)生態(tài)更多數(shù)字資產(chǎn)價(jià)值！

作者：中科基大數(shù)據(jù)元宇宙是一個(gè)去中心化的開放平臺(tái)，而為了維護(hù)這樣的平臺(tái)，需要建立一個(gè)公平的游戲規(guī)則，確保每個(gè)元宇宙的參與者通過這個(gè)規(guī)則都可以掙到錢，他們的利益都可以得到保
2022 區(qū)塊鏈 50 強(qiáng)榜單；垃圾NFT項(xiàng)目的十三個(gè)特性

本期關(guān)鍵字TerraZero在Decentraland完成元宇宙住房抵押貸款；騰訊發(fā)行齊白石畫作數(shù)字藏品；Ripple成為數(shù)字歐元協(xié)會(huì)成員；Gem上線稀有度排名功能；2022 區(qū)塊鏈 50 強(qiáng)榜
百度元宇宙希壤是什么？（附下載）

百度元宇宙希壤是什么，最近很多人關(guān)注。還有很多人問希壤怎么下載、百度希壤怎么進(jìn)入？今天小編帶你來全面了解一下。“希壤”是百度于2021年12月27日于百度AI開
2022年中國元宇宙產(chǎn)業(yè)系列研究報(bào)告-基礎(chǔ)設(shè)施篇（5）

傳感器是由敏感元件和轉(zhuǎn)換元件構(gòu)成，能夠感受規(guī)定的檢測量(物理量、化學(xué)量、生物量等)，并按照一定規(guī)律將檢測量轉(zhuǎn)化成可用的輸出信號的器件和裝置，進(jìn)而滿足信息的
影響元宇宙土地價(jià)格的五個(gè)因素

參考來源 | cryptonews編譯 | Ciel@iNFTnews.com元宇宙中的房地產(chǎn)價(jià)格主要取決于使用它的人數(shù)，以及為所有者創(chuàng)造收益的能力。專注于數(shù)字資產(chǎn)的投資公司LedgerPr
盤點(diǎn)9個(gè)主流元宇宙平臺(tái)，你都知道哪些？

隨著NFT的持續(xù)升溫，它也加入了現(xiàn)在的元宇宙浪潮。本文介紹元宇宙的基本概念以及九個(gè)最流行的元宇宙NFT平臺(tái)，如Decentraland、sandbox等。用熟悉的語言學(xué)習(xí) 以太
技術(shù)賦能，國內(nèi)首家寵物元宇宙平臺(tái)“Pet Meta”開啟虛擬養(yǎng)寵新方式

作者:易明未來，Pet Meta數(shù)字寵物藏品將是鏈接全球數(shù)億愛寵人群與元宇宙世界獨(dú)一無二的身份象征。首家面向國內(nèi)的寵物元宇宙平臺(tái)Pet Meta生長于“寵物經(jīng)濟(jì)”快速
2022年元宇宙系列報(bào)告：UGC當(dāng)?shù)溃琗R帶來新交互體驗(yàn)

UGC作為元宇宙的主要內(nèi)容創(chuàng)作模式，已經(jīng)越來越多的呈現(xiàn)于游戲、娛樂、社交、傳媒等方面，UGC模式勾勒了元宇宙的邊界，現(xiàn)今元宇宙UGC模式的主要呈現(xiàn)方式以元宇宙概念
你連元宇宙都不知道嗎？快來看看這四本元宇宙書籍吧

前有騰訊、阿里申請商標(biāo)注冊，后有Facebook宣布改名，若論當(dāng)前互聯(lián)網(wǎng)最火最熱的概念，當(dāng)屬“元宇宙”。“阿里元宇宙”“淘寶元宇宙”“釘釘元宇宙”“QQ元宇宙”“

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

小紅書首推大模型dots.llm1，中文性能力壓DeepSeek-V3

不同于傳統(tǒng)數(shù)字經(jīng)濟(jì)，元宇宙賦予商業(yè)生態(tài)更多數(shù)字資產(chǎn)價(jià)值！

2022 區(qū)塊鏈 50 強(qiáng)榜單；垃圾NFT項(xiàng)目的十三個(gè)特性

百度元宇宙希壤是什么？（附下載）

2022年中國元宇宙產(chǎn)業(yè)系列研究報(bào)告-基礎(chǔ)設(shè)施篇（5）

影響元宇宙土地價(jià)格的五個(gè)因素

盤點(diǎn)9個(gè)主流元宇宙平臺(tái)，你都知道哪些？

技術(shù)賦能，國內(nèi)首家寵物元宇宙平臺(tái)“Pet Meta”開啟虛擬養(yǎng)寵新方式

2022年元宇宙系列報(bào)告：UGC當(dāng)?shù)溃琗R帶來新交互體驗(yàn)

你連元宇宙都不知道嗎？快來看看這四本元宇宙書籍吧

最新推薦

保時(shí)捷推出虛擬超跑，車企元宇宙營銷這么香？

Meta、谷歌、微軟競相涌入元宇宙，小型企業(yè)該如何伺機(jī)而動(dòng)？

借VR產(chǎn)業(yè)東風(fēng)，江西搶灘布局“元宇宙”

元宇宙需要的5個(gè)重要安全功能

為什么元宇宙將永遠(yuǎn)改變體育和你的生活？

3月份值得關(guān)注的5個(gè)NFT項(xiàng)目

猜你喜歡

熱門推薦

相關(guān)資訊