當(dāng)前位置：首頁 > 元宇宙 > AI

英偉達(dá)推出通用深度研究系統(tǒng)：可接入任何 LLM，支持個人定制

來源：責(zé)編：時間：2025-09-11 11:27:28 47觀看

導(dǎo)讀英偉達(dá)也做深度研究智能體了。最新論文介紹了英偉達(dá)的通用深度研究（UDR）系統(tǒng)，該系統(tǒng)支持個人定制，可接入任何大語言模型（LLM）。這意味著它能夠圍繞任何語言模型運行，用戶可以完全自定義深度研究策略，并交給智能體實現(xiàn)

英偉達(dá)也做深度研究智能體了。

最新論文介紹了英偉達(dá)的通用深度研究（UDR）系統(tǒng)，該系統(tǒng)支持個人定制，可接入任何大語言模型（LLM）。

這意味著它能夠圍繞任何語言模型運行，用戶可以完全自定義深度研究策略，并交給智能體實現(xiàn)。

為展示其通用性，英偉達(dá)還為 UDR 配備了帶用戶界面的研究演示原型，可在 GitHub 上下載。

網(wǎng)友認(rèn)為，它使智能體的自主性得到了突破，非常適合企業(yè)工作。

自帶模型和策略

論文介紹，以往推出的所有深度研究智能體，都采用硬編碼方式，僅能通過固定的工具選擇來執(zhí)行特定研究策略。

而英偉達(dá)的 UDR 系統(tǒng)能夠圍繞任何 LLM 運行。

還能使用戶能夠在無需額外訓(xùn)練或微調(diào)的情況下，創(chuàng)建、編輯和優(yōu)化他們完全自定義的深度研究策略。

上圖呈現(xiàn)的是一個典型深度研究工具（DRT）的組成部分，與普通的對話式 LLMs 不同，DRTs 在生成報告之前傾向于持續(xù)向用戶更新其進(jìn)度。

一個 DRT 由兩部分組成：

一個簡單的用戶界面：用于接收研究提示，持續(xù)向用戶更新研究進(jìn)度，并顯示研究報告；

代理邏輯：代碼代理（通過代碼協(xié)調(diào)大語言模型與工具的組合運用）或 LLM 代理（直接利用模型自身的推理和工具調(diào)用能力）。

無論是 Gemini、Perplexity 還是 OpenAI，現(xiàn)有的 DRTs 主要采用僵化的研究策略，除研究提示詞外幾乎不留用戶定制空間；而在具有 LLM 代理的 DRTs 中，往往存在底層模型選擇單一、或僅使用訓(xùn)練后行為特征相同的同系列模型的問題。

雖然這個問題并不是阻礙 DRTs 廣泛流行的障礙，但它從三個方面限制了它們的實用性:

1、用戶既不能自主設(shè)置資源優(yōu)先級，也無法自動驗證信息的權(quán)威性，更無法控制搜索成本。

2、現(xiàn)有的 DRTs 做不出高價值行業(yè)需要的專業(yè)文檔分析方案。

3、現(xiàn)有的 DRTs 使用的模型是不可換的 —— 用戶不能隨意將最新或最強(qiáng)大的模型與深度研究智能體組合起來，以產(chǎn)生一個更強(qiáng)大的 DRT。

而英偉達(dá)的 UDR 系統(tǒng)提出了一種通用的解決方案來解決上述問題。

簡單地說，與專門的 DRT 不同，UDR 從用戶那里接收研究策略和研究提示，允許更高的定制程度。

UDR 能夠?qū)⒉呗詮淖匀徽Z言編譯成可執(zhí)行的研究編排代碼片段，然后執(zhí)行策略，并將最終報告交付給用戶。

其最顯著的創(chuàng)新特性包括：

通過自然語言定制研究策略。UDR 支持用戶用自然語言定義和編程自己的研究工作流，系統(tǒng)會將其轉(zhuǎn)換為可執(zhí)行、可審計的代碼。

這意味著用戶自己設(shè)計的智能操作流程，不需要重新訓(xùn)練 AI 模型或進(jìn)行復(fù)雜調(diào)試，就能直接投入實際使用。

與模型無關(guān)的研究工具架構(gòu)。UDR 將研究邏輯與語言模型解耦，使開發(fā)者能夠?qū)⑷魏未笳Z言模型 —— 無論供應(yīng)商或架構(gòu)如何 —— 封裝成功能完整的深度研究工具。

這樣一來，產(chǎn)品設(shè)計就有了更大發(fā)揮空間：既能選用最先進(jìn)的 AI 模型，又能搭配量身定制的研究方案，實現(xiàn)靈活組合的創(chuàng)新應(yīng)用。

用戶可控的策略驅(qū)動研究界面。下圖的原型展示了四大實用功能：實時修改研究策略、選擇預(yù)設(shè)策略庫、接收進(jìn)度通知、查看分析報告。

UDR 通過區(qū)分控制邏輯和語言模型推理來提升計算效率：整個深度研究流程的調(diào)度由生成的代碼全權(quán)負(fù)責(zé)，這些代碼直接在 CPU 上運行，避免了成本高出數(shù)十倍的語言模型推理開銷。

系統(tǒng)僅在用戶自定義研究策略明確要求時才會調(diào)用 LLM，且每次調(diào)用僅處理代碼變量中存儲的精簡定向文本片段。

這種雙重高效設(shè)計 —— 將流程調(diào)度交給 CPU 執(zhí)行邏輯，同時將 LLM 的使用嚴(yán)格限定在精準(zhǔn)高效的調(diào)用中 —— 不僅能夠降低 GPU 資源消耗，還可以顯著減少深度研究任務(wù)的總體執(zhí)行延遲和成本。

仍需進(jìn)一步探索

不過，這項工作目前還存在一定的局限性。

一方面，UDR 系統(tǒng)執(zhí)行研究策略的準(zhǔn)確度，完全取決于底層 AI 模型生成代碼的質(zhì)量。雖然研究人員通過強(qiáng)制要求代碼添加注釋來減少錯誤，但當(dāng)策略表述模糊或不夠具體時，系統(tǒng)偶爾還是會產(chǎn)生理解偏差或邏輯錯誤。

另一方面，UDR 默認(rèn)用戶設(shè)計的研究策略本身是合理且可執(zhí)行的。系統(tǒng)只會做基礎(chǔ)檢查，不會判斷策略步驟是否真正有效。如果策略設(shè)計得不好，最終生成的報告可能質(zhì)量低下、內(nèi)容不全，或者根本生成不出報告。

此外，還有一點在于，雖然 UDR 會實時顯示研究進(jìn)度，但當(dāng)前版本在執(zhí)行過程中不支持用戶干預(yù)（只能停止任務(wù)），也無法根據(jù)實時反饋調(diào)整研究方向。

所有決策都需要在研究開始前就預(yù)先設(shè)定好，這使得長時間或探索性的研究任務(wù)缺乏靈活性。

針對上述問題，研究人員也提出了進(jìn)一步的解決方案 —— 或者說改進(jìn)方案：

比如配備可修改定制的研究策略庫、進(jìn)一步探索如何讓用戶控制語言模型的自由推理過程、將大量用戶提示自動轉(zhuǎn)化為確定性控制的智能體等。

目前英偉達(dá)的 UDR 系統(tǒng)還只是原型階段，并未正式推出，但或許可以期待一下。

期待一個功能完整的正式版本。

參考鏈接：

[1]https://x.com/rohanpaul_ai/status/1964689864244203596

[2]https://research.nvidia.com/labs/lpr/udr/

[3]https://github.com/NVlabs/UniversalDeepResearch

本文來自微信公眾號：量子位（ID：QbitAI），作者：不圓，原標(biāo)題《英偉達(dá)推出通用深度研究系統(tǒng)，可接入任何 LLM，支持個人定制》

本文鏈接：http://www.www897cc.com/showinfo-45-27450-0.html英偉達(dá)推出通用深度研究系統(tǒng)：可接入任何 LLM，支持個人定制

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：大模型破譯甲骨文創(chuàng)下新 SOTA，復(fù)旦團(tuán)隊推出新框架

下一篇：我國首個：類腦脈沖大模型“瞬悉 1.0”問世，在國產(chǎn) GPU 算力平臺完成訓(xùn)練推理

標(biāo)簽：

熱門焦點

元媧2.7上線：虛擬人視頻制作速度瘋狂翻倍！

來源：清元宇宙炎炎夏日努力工作的Q仔的電腦都冒煙兒啦～今天要給大家介紹兩個新小伙伴——小元和小媧，他們將給大家解讀元媧2.7版本重磅更新內(nèi)容～大家掌聲歡迎～～～本次更
元宇宙里掀起回憶殺？這波虛擬懷舊營銷主打一個極限反差

來源：首席品牌官從被稱為“元宇宙元年”的2021年開始，幾乎所有品牌都在迫不及待地“入駐”元宇宙。而一提及品牌們的元宇宙玩法，相信多數(shù)人腦海里首先浮現(xiàn)
這場虛擬人爭奪戰(zhàn)，互聯(lián)網(wǎng)巨頭下場先贏一半？

撰文/ 孟會緣近兩年間，要論引得無數(shù)互聯(lián)網(wǎng)巨頭競折腰的一大熱門產(chǎn)業(yè)，莫過于元宇宙領(lǐng)域中的數(shù)字人了。作為繼數(shù)字藏品之后，開發(fā)元宇宙的又一重點落地項目，互聯(lián)網(wǎng)
游戲玩家才是最“元宇宙”的

01元宇宙的概念，最早由科幻作家尼爾·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一個脫胎于現(xiàn)實世界，又與現(xiàn)實世界平行、相互影響，并且始終在線的虛擬世
現(xiàn)在的元宇宙：一款低配版的科幻游戲

在2021年的歲末之際，不禁感嘆元宇宙元年之熱鬧，從元宇宙NFT頭像，到元宇宙數(shù)字地產(chǎn)，再到元宇宙旅游景區(qū)等等，仿佛科幻感十足的元宇宙眨眼間就從人們的概念認(rèn)知中完全
吸金31億美元，誰在催火2021年的鏈游？

2021年究竟發(fā)生了什么，才使得鏈游領(lǐng)域在這年一飛沖天？作者：廖羽2022年2月16日，Invest Game發(fā)布《2021年全球游戲投資報告》，報告顯示，游戲行業(yè)的投資重點正在向區(qū)塊
2030年的元宇宙產(chǎn)業(yè)將會如何發(fā)展？

對互聯(lián)網(wǎng)巨頭傳統(tǒng)業(yè)務(wù)的反壟斷政策倒逼互聯(lián)網(wǎng)企業(yè)顛覆創(chuàng)新，尋找新的增長點，移動互聯(lián)網(wǎng)流量空間見頂之際，元宇宙時代紅利已然開啟。序章：元宇宙應(yīng)用場景大猜想元宇
NFT Insider #47：YGG發(fā)布2021Q4社區(qū)報告，GameFi領(lǐng)域1月份獲超10億美元融資

引言：NFT Insider由WHALE社區(qū)、BeepCrypto聯(lián)合出品，濃縮每周NFT新聞，為大家?guī)黻P(guān)于NFT最全面、最新鮮、最有價值的訊息。每期周報將從NFT市場數(shù)據(jù)，藝術(shù)新聞類，游戲
元宇宙存在的意義和價值

科技公司目前都在猶豫，看誰能在元宇宙上押下更大的賭注。然而，除了巨額的資金投入，到底要怎樣才能獲勝在很大程度上還沒有得到證實。它是否僅僅是對當(dāng)前數(shù)字景觀

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

英偉達(dá)推出通用深度研究系統(tǒng)：可接入任何 LLM，支持個人定制

元媧2.7上線：虛擬人視頻制作速度瘋狂翻倍！

元宇宙里掀起回憶殺？這波虛擬懷舊營銷主打一個極限反差

這場虛擬人爭奪戰(zhàn)，互聯(lián)網(wǎng)巨頭下場先贏一半？

游戲玩家才是最“元宇宙”的

現(xiàn)在的元宇宙：一款低配版的科幻游戲

吸金31億美元，誰在催火2021年的鏈游？

2030年的元宇宙產(chǎn)業(yè)將會如何發(fā)展？

NFT Insider #47：YGG發(fā)布2021Q4社區(qū)報告，GameFi領(lǐng)域1月份獲超10億美元融資

元宇宙存在的意義和價值

最新推薦

刷完一場元宇宙世界杯音樂盛典，我爽了

中國虛擬數(shù)字人如何橫向拓展市場需求，探索發(fā)展場景?

“我沒搞懂元宇宙，但一天能賺9w塊”

從英式拍到荷蘭拍，看傳統(tǒng)金融拍賣玩法如何玩轉(zhuǎn)NFT市場交易

如何在元宇宙中建立品牌忠誠度

Steam 禁止NFT和加密貨幣原因曝光

猜你喜歡

熱門推薦

相關(guān)資訊

英偉達(dá)推出通用深度研究系統(tǒng)：可接入任何 LLM，支持個人定制

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

英偉達(dá)推出通用深度研究系統(tǒng)：可接入任何 LLM，支持個人定制