當前位置：首頁 > 元宇宙 > AI

清華大學研發 LLM4VG 基準：用于評估 LLM 視頻時序定位性能

來源：責編：時間：2024-01-03 09:09:34 378觀看

導讀 12 月 29 日消息，大語言模型（LLM）的觸角已經從單純的自然語言處理，擴展到文本、音頻、視頻等多模態領域，而其中一項關鍵就是視頻時序定位（Video Grounding，VG）。VG 任務的目的基于給定查詢（一句描述），然后在目標視頻段中

12 月 29 日消息，大語言模型（LLM）的觸角已經從單純的自然語言處理，擴展到文本、音頻、視頻等多模態領域，而其中一項關鍵就是視頻時序定位（Video Grounding，VG）。

VG 任務的目的基于給定查詢（一句描述），然后在目標視頻段中定位起始和結束時間，核心挑戰在于時間邊界定位的精度。

清華大學研究團隊近日推出了“LLM4VG”基準，這是一個專門設計用于評估 LLM 在 VG 任務中的性能。

此基準考慮了兩種主要策略：第一種涉及直接在文本視頻數據集（VidLLM）上訓練的視頻 LLM，第二種是結合傳統的 LLM 與預訓練的視覺模型。

在第一種策略中，VidLLM 直接處理視頻內容和 VG 任務指令，根據其對文本-視頻的訓練輸出預測。

第二種策略更為復雜，涉及 LLM 和視覺描述模型。這些模型生成與 VG 任務指令集成的視頻內容的文本描述，通過精心設計的提示。

這些提示經過專門設計，可以有效地將 VG 的指令與給定的視覺描述結合起來，從而讓 LLM 能夠處理和理解有關任務的視頻內容。

據觀察，VidLLM 盡管直接在視頻內容上進行訓練，但在實現令人滿意的 VG 性能方面仍然存在很大差距。這一發現強調了在訓練中納入更多與時間相關的視頻任務以提高性能的必要性。

而第二種策略優于 VidLLM，為未來的研究指明了一個有希望的方向。該策略主要限制于視覺模型的局限性和提示詞的設計，因此能夠生成詳細且準確的視頻描述后，更精細的圖形模型可以大幅提高 LLM 的 VG 性能。

總之，該研究對 LLM 在 VG 任務中的應用進行了開創性的評估，強調了在模型訓練和提示設計中需要更復雜的方法。

附上論文參考地址：https://arxiv.org/pdf/2312.14206.pdf

本文鏈接：http://www.www897cc.com/showinfo-45-3110-0.html清華大學研發 LLM4VG 基準：用于評估 LLM 視頻時序定位性能

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：廣汽埃安2023年銷量大放異彩，累計突破48萬輛大關

下一篇：教 AI 入侵 AI，科學家研發 Masterkey 新方式

標簽：

熱門焦點

人間誠實周鴻祎：360 All in 大模型的六個解讀

主筆 / 村口有牛文章架構師 / 毛自聰出品 / 巨頭財經5月至今，人間躁動，各路大模型你方唱罷我登場，VC圈互聯網圈媒體圈已近癲狂。誰也沒想到，今日，360再度刷屏，老牌互聯網巨頭展現
在元宇宙賣酸奶，這波聯動燃爆了！

來源：品牌頭版或許，每個人心中都住著一個小饞孩。可能是童年時百吃不厭，覺得新奇又有趣的跳跳糖；可能是味道香甜，咬下一口嘎嘣脆的扁桃仁；還有可能，是某種不知為什么，就是很愛吃的
字節、騰訊、網易鏖戰元宇宙背后，大廠究竟在爭奪什么？

正當互聯網商業躊躇不前，互聯網大廠為了在存量中的增長擠破頭皮之時，元宇宙的概念被資本點燃。先是Facebook更名Meta正式進軍元宇宙，然后字節跳動收購了一家VR硬
冰墩墩的NFT暴漲千倍？真相則是價格暴跌、成交遇冷

《區塊鏈日報》記者查證，近日來冰墩墩數字藏品交易數量出現大幅下滑，而所謂的暴漲千倍更是有價無市的自嗨。昨日，北京冬奧會正式閉幕。在這屆冬奧會上，吉祥物“冰
多地釋放積極信號，元宇宙正成為地方爭先競逐的主戰場？

2月21日，2022中國·金魚嘴元宇宙生態賦能大會在南京建鄴區金魚嘴基金街區舉辦，南京建鄴區金魚嘴基金街區宣布計劃出資1億元，支持元宇宙行業發展。同時，會上發布了
扎克伯格演示了一種“造物主”式的元宇宙語音機器人工具

前身為Facebook的Meta公司今天展示了一個人工智能系統的Demo，該系統使人們能夠通過語音命令生成或導入虛擬世界中的事物。該公司認為這個被稱為 "Builder Bot "
王老吉啟動元宇宙“吉空間”，HTC發布元宇宙應用VIVERSE

今日《元宇宙新鮮事》有：王老吉啟動元宇宙“吉空間”；HTC發布元宇宙應用VIVERSE；Meta將在馬德里構建一個元宇宙創新中心；央視網《新聞+》推出系列視頻《聊聊元宇宙
元宇宙平臺會是上世紀末的互聯網嗎？

“元宇宙”火了好幾個月，互聯網大廠忙于布局，資本市場熱烈追捧。然而很多人還是看不明白，更多的人覺得這是一場泡沫，一場騙局。一開始接觸這個怪里怪氣的名詞，感覺
這場虛擬發布會，當面“造假”！

英偉達去年4月份那場發布會，你曾看出什么不對勁的地方嗎？你品，你細品——在計算機圖形學頂會SIGGRAPH 2021上，英偉達通過一部紀錄片自曝：那場發布會內藏玄機~你看到

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

清華大學研發 LLM4VG 基準：用于評估 LLM 視頻時序定位性能

人間誠實周鴻祎：360 All in 大模型的六個解讀

在元宇宙賣酸奶，這波聯動燃爆了！

字節、騰訊、網易鏖戰元宇宙背后，大廠究竟在爭奪什么？

冰墩墩的NFT暴漲千倍？真相則是價格暴跌、成交遇冷

多地釋放積極信號，元宇宙正成為地方爭先競逐的主戰場？

扎克伯格演示了一種“造物主”式的元宇宙語音機器人工具

王老吉啟動元宇宙“吉空間”，HTC發布元宇宙應用VIVERSE

元宇宙平臺會是上世紀末的互聯網嗎？

這場虛擬發布會，當面“造假”！

最新推薦

歐盟人工智能法案：四種AI系統風險類型的劃分及監管措施

ChatGPT訪問量增速下滑，AI真的是一場泡沫嗎？

這場虛擬人爭奪戰，互聯網巨頭下場先贏一半？

元宇宙是推動NFT發展的初始家園

韓國國民銀行將推出韓國首個加密貨幣 ETF

數字經濟、數據要素與數字治理

猜你喜歡

熱門推薦

相關資訊