當前位置：首頁 > 科技 > 芯片

英偉達聯合推出超強多模態模型DAM

來源：icspec 責編：時間：2025-04-28 07:35:34 146觀看

導讀據報道，英偉達與加州大學伯克利分校、加州大學舊金山分校團隊合作，推出了一款名為Describe Anything Model（DAM）的多模態模型。這款模型僅包含30億參數，卻能夠精準描述圖像和視頻中的任何細節。DAM模型專注于詳細局部標注（D

據報道，英偉達與加州大學伯克利分校、加州大學舊金山分校團隊合作，推出了一款名為Describe Anything Model（DAM）的多模態模型。這款模型僅包含30億參數，卻能夠精準描述圖像和視頻中的任何細節。
DAM模型專注于詳細局部標注（DLC），即為特定區域生成詳細且精確的描述。通過兩大創新，研究人員在細節與上下文之間找到了平衡。其一是焦點提示，對目標區域進行高分辨率編碼，就像給模型配備了一副“放大鏡”，清晰捕捉到局部區域的細微特征。其二是局部視覺骨干網絡，將精確定位的特定區域與上下文無縫整合。
在項目主頁中，研究團隊展示了更多精彩demo。用戶通過點、框、涂鴉或掩碼的交互，即可一鍵生成描述。例如，上傳一張柯基在草地上奔跑的圖片，選中柯基，DAM會生成一段詳細的描述：“一只中等體型的狗，擁有濃密的紅棕色毛發，腹部和腿部為白色。這只狗尾巴蓬松，耳朵尖立，戴著帶有銀色吊牌的紅色項圈。它張著嘴露出牙齒，舌頭伸在外面。狗呈奔跑姿勢，前腿向前伸展，后腿向后伸直。”
DAM的技術架構確保了其在生成關鍵詞、短語，甚至是多句式的復雜描述時，都能保持高精度和連貫性。此外，研究團隊設計了基于半監督學習的流水線（DLC-SDP），通過兩階段策略構建大規模訓練數據。
為了公平評估DLC模型，研究團隊提出了全新基準DLC-Bench。通過LLM判斷，檢查描述的正確細節和錯誤缺失，而非簡單對比文本。在DLC-Bench和其他7個涵蓋圖像與視頻的基準測試中，DAM全面超越現有模型，樹立了新的標桿。
DAM的優勢主要有三大點：更詳細、更準確；更少幻覺；多場景適用。其強大能力為眾多應用場景打開了大門，未來諸如數據標注、醫療影像、內容創作等領域，都可以加速落地。
Long (Tony) Lian是UC伯克利電子工程與計算機科學博士研究生，他的研究主要聚焦于通過強化學習開發具備推理能力的大模型與視覺語言模型。此前，他曾在英偉達研究院Deep Imagination Research團隊實習。Long (Tony) Lian本科畢業于UC伯克利計算機科學專業。

本文鏈接：http://www.www897cc.com/showinfo-27-147931-0.html英偉達聯合推出超強多模態模型DAM

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：本田電動化新作：燁GT與P7雙車齊發

下一篇：和輝光電遞表港交所，AMOLED面板業務表現亮眼

標簽：

熱門焦點

Redmi Pad評測：紅米充滿野心的一次嘗試

從Note系列到K系列，從藍牙耳機到筆記本電腦，紅米不知不覺之間也已經形成了自己頗有競爭力的產品體系，在中端和次旗艦市場上甚至要比小米新機的表現來得更好，正所謂“大丈夫生居
8月總票房已突破10億！《封神》第一：口碑已經成了

8月5日消息，據燈塔專業版數據，截至8月5日9時35分，8月總票房（含預售）已突破10億。其中，《封神》以大比分的優勢領先。根據官方消息，目前該片總票房已經超過14.
Raft算法：保障分布式系統共識的穩健之道

1. 什么是Raft算法？Raft 是英文”Reliable、Replicated、Redundant、And Fault-Tolerant”（“可靠、可復制、可冗余、可容錯”）的首字母縮寫。Raft算法是一種用于在分布式系統
讓我們一起聊聊文件的操作

文件【1】文件是什么？文件是保存數據的地方，是數據源的一種，比如大家經常使用的word文檔、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存數據，它既可以保
使用LLM插件從命令行訪問Llama 2

最近的一個大新聞是Meta AI推出了新的開源授權的大型語言模型Llama 2。這是一項非常重要的進展：Llama 2可免費用于研究和商業用途。(幾小時前，swyy發現它已從LLaMA 2更名為Lla
一文搞定Java NIO，以及各種奇葩流

大家好，我是哪吒。很多朋友問我，如何才能學好IO流，對各種流的概念，云里霧里的，不求甚解。用到的時候，現百度，功能雖然實現了，但是為什么用這個？不知道。更別說效率問題了~下次再遇到，
Temu起訴SHEIN，跨境電商戰事升級

來源 | 伯虎財經（bohuFN）作者 | 陳平安日前據外媒報道，拼多多旗下跨境電商平臺Temu正對競爭對手SHEIN提起新訴訟，訴狀稱Shein“利用市場支配力量強迫服裝廠商與之簽訂獨家
華為和江淮汽車合作開發百萬元問界MPV？雙方回應來了

8月1日消息，郭明錤今天在社交平臺發文稱，華為正在和江淮汽車合作，開發售價在100萬元的問界MPV，預計在2024年第2季度量產，銷量目標為上市首年交付5萬輛。
三星推出Galaxy Tab S9系列平板電腦以及Galaxy Watch6系列智能手表

2023年7月26日，三星電子正式發布了Galaxy Z Flip5與Galaxy Z Fold5。除此之外，Galaxy Tab S9系列平板電腦以及三星Galaxy Watch6系列智能手表也同期

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

英偉達聯合推出超強多模態模型DAM

Redmi Pad評測：紅米充滿野心的一次嘗試

8月總票房已突破10億！《封神》第一：口碑已經成了

Raft算法：保障分布式系統共識的穩健之道

讓我們一起聊聊文件的操作

使用LLM插件從命令行訪問Llama 2

一文搞定Java NIO，以及各種奇葩流

Temu起訴SHEIN，跨境電商戰事升級

華為和江淮汽車合作開發百萬元問界MPV？雙方回應來了

三星推出Galaxy Tab S9系列平板電腦以及Galaxy Watch6系列智能手表

最新推薦

猜你喜歡

熱門推薦

相關資訊