日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 科技  > 軟件

小紅書開源多模態(tài)大模型dots.vlm1,視覺理解與推理能力接近頂尖水平

來源: 責(zé)編: 時(shí)間:2025-08-08 15:09:10 32觀看
導(dǎo)讀小紅書,這家以“種草”文化著稱的社交平臺,近期在AI技術(shù)自研領(lǐng)域邁出了重要步伐,連續(xù)兩個月內(nèi)發(fā)布了三款開源模型,引起了業(yè)界的廣泛關(guān)注。最新亮相的多模態(tài)大模型dots.vlm1,憑借其強(qiáng)大的視覺理解和推理能力,展現(xiàn)了接近Gemin

小紅書,這家以“種草”文化著稱的社交平臺,近期在AI技術(shù)自研領(lǐng)域邁出了重要步伐,連續(xù)兩個月內(nèi)發(fā)布了三款開源模型,引起了業(yè)界的廣泛關(guān)注。最新亮相的多模態(tài)大模型dots.vlm1,憑借其強(qiáng)大的視覺理解和推理能力,展現(xiàn)了接近Gemini 2.5 Pro閉源模型的實(shí)力。2UJ28資訊網(wǎng)——每日最新資訊28at.com

在競爭激烈的AI領(lǐng)域,各大科技公司紛紛推出自家模型,OpenAI的Claude升級至4.1版本,谷歌則推出了用于生成游戲世界的Genie 3,引發(fā)社區(qū)熱議。國產(chǎn)模型也不甘示弱,HuggingFace平臺上的前十名開源模型中,已有多個來自國內(nèi)團(tuán)隊(duì)。然而,仔細(xì)觀察這些排名靠前的模型,不難發(fā)現(xiàn),大多數(shù)仍為文本模型,缺乏多模態(tài)能力。2UJ28資訊網(wǎng)——每日最新資訊28at.com

2UJ28資訊網(wǎng)——每日最新資訊28at.com

小紅書的人文智能實(shí)驗(yàn)室(Humane Intelligence Lab,簡稱hi lab)近日低調(diào)開源了其首個多模態(tài)大模型dots.vlm1,為視覺語言模型(VLM)領(lǐng)域帶來了新氣象。這款模型基于小紅書自研的12億參數(shù)NaViT視覺編碼器和DeepSeek V3大語言模型構(gòu)建,不僅在視覺理解和推理任務(wù)上表現(xiàn)出色,還保持了純文本任務(wù)中的競爭力。2UJ28資訊網(wǎng)——每日最新資訊28at.com

hi lab此前開源的dots.ocr文檔解析模型已在Huggingface平臺上獲得熱榜第七的好成績,盡管其基礎(chǔ)模型參數(shù)僅為17億,但性能卻達(dá)到了業(yè)界領(lǐng)先水平。這一成就顯示了hi lab團(tuán)隊(duì)在AI技術(shù)自研方面的認(rèn)真態(tài)度和強(qiáng)大實(shí)力。2UJ28資訊網(wǎng)——每日最新資訊28at.com

dots.vlm1在多個視覺評測集上的表現(xiàn)接近當(dāng)前領(lǐng)先的Gemini 2.5 Pro與Seed-VL1.5 Thinking模型,顯示出強(qiáng)大的圖文理解與推理能力。在文本推理任務(wù)上,dots.vlm1的表現(xiàn)與DeepSeek-R1-0528相當(dāng),盡管在數(shù)學(xué)和代碼能力上已具備一定的通用性,但在更多樣化的推理任務(wù)上仍有提升空間。2UJ28資訊網(wǎng)——每日最新資訊28at.com

在實(shí)際測試中,dots.vlm1展現(xiàn)了令人驚艷的能力。面對復(fù)雜圖表和數(shù)獨(dú)問題,模型能夠逐步分析并給出正確答案,甚至在長時(shí)間思考過程中出現(xiàn)了類似DeepSeek的“啊哈時(shí)刻”,體現(xiàn)了其真正的思考和推理能力。dots.vlm1還能解決紅綠色盲數(shù)字問題,進(jìn)行數(shù)學(xué)計(jì)算,甚至模仿李白詩風(fēng)創(chuàng)作詩詞,展現(xiàn)了其全面的多模態(tài)能力。2UJ28資訊網(wǎng)——每日最新資訊28at.com

dots.vlm1的技術(shù)架構(gòu)由三個核心組件構(gòu)成:全自研的NaViT視覺編碼器、輕量級的MLP適配器以及DeepSeek V3 MoE大語言模型。這一架構(gòu)通過三階段流程進(jìn)行訓(xùn)練,包括視覺編碼器預(yù)訓(xùn)練、VLM預(yù)訓(xùn)練和VLM后訓(xùn)練,旨在提升模型對多樣視覺數(shù)據(jù)的感知能力和泛化能力。2UJ28資訊網(wǎng)——每日最新資訊28at.com

NaViT視覺編碼器是dots.vlm1的核心之一,它完全從零開始訓(xùn)練,原生支持動態(tài)分辨率,專為視覺語言模型設(shè)計(jì)。通過兩階段的訓(xùn)練策略,NaViT編碼器在基礎(chǔ)視覺和語義感知以及高分辨率輸入處理方面均表現(xiàn)出色。2UJ28資訊網(wǎng)——每日最新資訊28at.com

在預(yù)訓(xùn)練數(shù)據(jù)方面,hi lab為dots.vlm1準(zhǔn)備了跨模態(tài)互譯數(shù)據(jù)和跨模態(tài)融合數(shù)據(jù)兩大類別,旨在構(gòu)建一個全譜系的數(shù)據(jù)分布,覆蓋所有可被人類理解且可轉(zhuǎn)化為離散token序列的視覺信息。這些數(shù)據(jù)包括普通圖像、復(fù)雜圖表、OCR場景圖像、視頻幀以及Grounding監(jiān)督數(shù)據(jù)等,為模型的多模態(tài)能力提供了有力支持。2UJ28資訊網(wǎng)——每日最新資訊28at.com

小紅書之所以在AI大模型領(lǐng)域加大自研力度,是因?yàn)槎嗄B(tài)能力已成為通向通用人工智能(AGI)的必經(jīng)之路。通過模擬人類利用多種感官綜合感知世界的方式,多模態(tài)AI能夠形成更全面、細(xì)致的理解,對復(fù)雜場景作出更整體化的判斷。在自動駕駛、具身智能等領(lǐng)域,VLM正成為機(jī)器人理解和融入人類社會的重要工具。2UJ28資訊網(wǎng)——每日最新資訊28at.com

2UJ28資訊網(wǎng)——每日最新資訊28at.com

小紅書hi lab在AI技術(shù)自研上的決心和投入不僅體現(xiàn)在dots.vlm1上,還體現(xiàn)在其不斷壯大的dots模型家族中。從dots.llm1到dots.ocr再到dots.vlm1,小紅書正逐步構(gòu)建起自己的AI技術(shù)生態(tài)。未來,隨著AI技術(shù)的不斷發(fā)展,小紅書有望在內(nèi)容理解、個性化推薦以及社區(qū)交互等方面實(shí)現(xiàn)更多創(chuàng)新應(yīng)用。2UJ28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-26-176295-0.html小紅書開源多模態(tài)大模型dots.vlm1,視覺理解與推理能力接近頂尖水平

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 蘋果“美國制造計(jì)劃”啟動,未來四年將在美新增2萬個就業(yè)崗位

下一篇: 博通Jericho4芯片:破解大型AI運(yùn)算功耗難題,實(shí)現(xiàn)多數(shù)據(jù)中心高效協(xié)同

標(biāo)簽:
  • 熱門焦點(diǎn)
  • Find N3入網(wǎng):最高支持16+1TB

    OPPO將于近期登場的Find N3折疊屏目前已經(jīng)正式入網(wǎng),型號為PHN110。本次Find N3在外觀方面相比前兩代有很大的變化,不再是小號的橫向折疊屏,而是跟別的廠商一樣采用了較為常見的
  • 直屏旗艦來了 iQOO 12和K70 Pro同臺競技

    旗艦機(jī)基本上使用的都是雙曲面屏幕,這就讓很多喜歡直屏的愛好者在苦等一款直屏旗艦,這次,你們等到了。據(jù)博主數(shù)碼閑聊站帶來的最新爆料稱,Redmi下代旗艦K70 Pro和iQOO 12兩款手
  • 6月安卓手機(jī)性價(jià)比榜:Note 12 Turbo斷層式碾壓

    6月份有一個618,雖然這是京東周年慶的日子,但別的電商也都不約而同的跟進(jìn)了,反正促銷沒壞處,廠商和用戶都能滿意。618期間一些產(chǎn)品也出現(xiàn)了歷史低價(jià),那么各個價(jià)位段的產(chǎn)品性價(jià)比
  • 5月安卓手機(jī)好評榜:魅族20 Pro奪冠

    性能榜和性價(jià)比榜之后,我們來看最后的安卓手機(jī)好評榜,數(shù)據(jù)來源安兔兔評測,收集時(shí)間2023年5月1日至5月31日,僅限國內(nèi)市場。第一名:魅族20 Pro好評率:97.50%不得不感慨魅族老品牌還
  • 每天一道面試題-CPU偽共享

    前言:了不起:又到了每天一到面試題的時(shí)候了!學(xué)弟,最近學(xué)習(xí)的怎么樣啊 了不起學(xué)弟:最近學(xué)習(xí)的還不錯,每天都在學(xué)習(xí),每天都在進(jìn)步! 了不起:那你最近學(xué)習(xí)的什么呢? 了不起學(xué)弟:最近在學(xué)習(xí)C
  • 本地生活這塊肥肉,拼多多也想吃一口

    出品/壹覽商業(yè) 作者/李彥編輯/木魚拼多多也看上本地生活這塊蛋糕了。近期,拼多多在App首頁“充值中心”入口上線了本機(jī)生活界面。壹覽商業(yè)發(fā)現(xiàn),該界面目前主要
  • 疑似小米14外觀設(shè)計(jì)圖曝光:后置相機(jī)模組變化不大

    下半年的大幕已經(jīng)開啟,而誰將成為下半年手機(jī)圈的主角就成為了大家關(guān)注的焦點(diǎn),其中被傳有望拿下新一代驍龍8 Gen3旗艦芯片的小米14系列更是備受大家矚
  • 支持aptX Lossless無損傳輸 iQOO TWS 1賽道版發(fā)布限時(shí)優(yōu)惠價(jià)369元

    2023年7月4日,“無損音質(zhì),聲動人心”iQOO TWS 1正式發(fā)布,支持aptX Lossless無損傳輸,限時(shí)優(yōu)惠價(jià)369元。iQOO TWS 1耳機(jī)率先支持端到端aptX Lossless無
  • 滴滴違法違規(guī)被罰80.26億 共存在16項(xiàng)違法事實(shí)

    滴滴違法違規(guī)被罰80.26億 存在16項(xiàng)違法事實(shí)開始于2121年7月,歷經(jīng)一年時(shí)間,網(wǎng)絡(luò)安全審查辦公室對“滴滴出行”網(wǎng)絡(luò)安全審查終于有了一個暫時(shí)的結(jié)束。據(jù)“網(wǎng)信
Top 主站蜘蛛池模板: 黔东| 锡林郭勒盟| 古浪县| 河池市| 隆安县| 鄂托克旗| 淮滨县| 报价| 赤水市| 禄丰县| 滦平县| 宿松县| 枝江市| 台前县| 大余县| 丹棱县| 铜鼓县| 陇南市| 随州市| 清苑县| 昭觉县| 迁西县| 将乐县| 克山县| 咸阳市| 万载县| 顺平县| 崇文区| 武义县| 平顶山市| 天气| 道孚县| 深圳市| 岳阳县| 新郑市| 南投县| 定结县| 崇明县| 绥阳县| 塔城市| 杨浦区|