5 月 21 日消息,英偉達打造了用于視頻搜索與總結(VSS)的 AI Blueprint,該藍圖由NVIDIA Metropolis平臺驅動,現已全面推出,可為開發者提供構建和部署 AI 智能體的工具,用于分析大量實時和存檔視頻。
由視覺語言模型(VLM)驅動的一系列視覺 AI 智能體和生產力助手即將上線。結合計算機視覺模型與超智能大語言模型(LLM),這些視頻分析 AI 智能體可幫助企業查看、搜索并總結海量視頻。通過實時分析視頻或處理 TB(terabytes)級錄制視頻,視頻分析 AI 智能體正在眾多行業釋放前所未有的價值和機遇。
附示例如下,該工具采用問答形式,可幫助讀者分析球賽、裝機,甚至能找到視頻中的某個時間段提到了某個特定詞匯。
VSS 藍圖集成了NVIDIA AI Enterprise軟件平臺,包括用于 VLM、LLM 的NVIDIA NIM微服務,以及用于 RAG 的先進 AI 框架。通過 VSS 藍圖,用戶總結視頻的速度比實時觀看快 100 倍。例如,60 分鐘的視頻可在不到 1 分鐘的時間內用文字總結出來。
它可以同時處理數百個實時視頻流或多組視頻片段。除了視覺理解,它還支持音頻轉錄。在音頻至關重要的場景中,將語音轉換為文本可增強理解,例如訓練視頻、主題演講或團隊會議等。
本文鏈接:http://www.www897cc.com/showinfo-45-13089-0.html英偉達推出視頻搜索和總結工具 AI Blueprint,比用戶實時觀看快 100 倍
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com