日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 元宇宙 > AI

蘋果攜手復(fù)旦大學(xué)推 StreamBridge 端側(cè)視頻大語言模型框架,AI 可實(shí)時(shí)響應(yīng)視頻流

來源: 責(zé)編: 時(shí)間:2025-05-15 09:51:22 80觀看
導(dǎo)讀 5 月 13 日消息,科技媒體 marktechpost 今天(5 月 13 日)發(fā)布博文,報(bào)道稱蘋果公司聯(lián)合復(fù)旦大學(xué),推出 StreamBridge 端側(cè)視頻大語言模型(Video-LLMs)框架,助力 AI 理解直播流視頻。直播流視頻理解的挑戰(zhàn)與需求傳統(tǒng)視頻

5 月 13 日消息,科技媒體 marktechpost 今天(5 月 13 日)發(fā)布博文,報(bào)道稱蘋果公司聯(lián)合復(fù)旦大學(xué),推出 StreamBridge 端側(cè)視頻大語言模型(Video-LLMs)框架,助力 AI 理解直播流視頻。RS028資訊網(wǎng)——每日最新資訊28at.com

直播流視頻理解的挑戰(zhàn)與需求RS028資訊網(wǎng)——每日最新資訊28at.com

傳統(tǒng)視頻大語言模型擅長處理靜態(tài)視頻,但無法適應(yīng)機(jī)器人技術(shù)和自動(dòng)駕駛等需要實(shí)時(shí)感知的場景,在這些場景下,要求模型能快速理解直播視頻流內(nèi)容,并做出反應(yīng)。RS028資訊網(wǎng)——每日最新資訊28at.com

現(xiàn)有的模型面臨兩大難題:一是多輪實(shí)時(shí)理解,即在處理最新視頻片段時(shí)需保留歷史視覺和對話上下文;二是主動(dòng)響應(yīng),要求模型像人類一樣主動(dòng)監(jiān)控視頻流,并在無明確指令的情況下及時(shí)輸出反饋。RS028資訊網(wǎng)——每日最新資訊28at.com

StreamBridge 框架與創(chuàng)新技術(shù)RS028資訊網(wǎng)——每日最新資訊28at.com

為解決上述問題,蘋果公司與復(fù)旦大學(xué)的研究者開發(fā)了 StreamBridge 框架。該框架通過內(nèi)存緩沖區(qū)和輪次衰減壓縮策略,支持長上下文交互。RS028資訊網(wǎng)——每日最新資訊28at.com

RS028資訊網(wǎng)——每日最新資訊28at.com

該框架還引入了一個(gè)輕量化的獨(dú)立激活模型,無縫集成現(xiàn)有視頻大語言模型,實(shí)現(xiàn)主動(dòng)響應(yīng)功能。研究團(tuán)隊(duì)還推出了 Stream-IT 數(shù)據(jù)集,包含約 60 萬個(gè)樣本,融合了視頻與文本序列,支持多樣化的指令格式,旨在提升流式視頻理解能力。RS028資訊網(wǎng)——每日最新資訊28at.com

StreamBridge 在主流離線模型如 LLaVA-OV-7B、Qwen2-VL-7B 和 Oryx-1.5-7B 上進(jìn)行了測試。結(jié)果顯示,Qwen2-VL 在 OVO-Bench 和 Streaming-Bench 上的平均分分別提升至 71.30 和 77.04,超越了 GPT-4o 和 Gemini 1.5 Pro 等專有模型。RS028資訊網(wǎng)——每日最新資訊28at.com

Oryx-1.5 也取得了顯著進(jìn)步,而 LLaVA-OV 性能略有下降。Stream-IT 數(shù)據(jù)集的微調(diào)進(jìn)一步提升了所有模型的表現(xiàn),證明了 StreamBridge 在流式視頻理解領(lǐng)域的強(qiáng)大潛力。RS028資訊網(wǎng)——每日最新資訊28at.com

附上參考地址RS028資訊網(wǎng)——每日最新資訊28at.com

StreamBridge: Turning Your Offline Video Large Language Model into a Proactive Streaming AssistantRS028資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12847-0.html蘋果攜手復(fù)旦大學(xué)推 StreamBridge 端側(cè)視頻大語言模型框架,AI 可實(shí)時(shí)響應(yīng)視頻流

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 高管:AI 未來可自主生成知識(shí),商業(yè)與科研迎來革命

下一篇: OpenAI 擴(kuò)展 ChatGPT AI 深度研究連接器,集成微軟 OneDrive 和 SharePoint

標(biāo)簽:
  • 熱門焦點(diǎn)
  • 《從營銷AIGC化到AIGC營銷化》報(bào)告發(fā)布

    來源:清元宇宙7月2日上午,清華大學(xué)元宇宙文化實(shí)驗(yàn)室舉辦元宇宙在線沙龍“AIGC熱潮與應(yīng)用”。會(huì)議中,清華大學(xué)新聞與傳播學(xué)院教授、元宇宙文化實(shí)驗(yàn)室主任、新媒體研究
  • 三院士三教授熱聊元宇宙&——AIGC,學(xué)術(shù)界怎么看?

    來源:清元宇宙在近日舉辦的中國江寧2023元宇宙產(chǎn)業(yè)·人才高峰論壇暨AIGC發(fā)展大會(huì)上,中國工程院院士譚建榮、劉韻潔、鄭緯民出席并發(fā)表了主旨演講。除了三大院士,還有清華
  • 大廠元宇宙,又菜又愛玩

    撰文 | 吳先之 編輯 | 王 潘當(dāng)下所有大廠推出的元宇宙產(chǎn)品,所能帶來的沉浸式體驗(yàn)并不多,好在國內(nèi)外科技巨頭在bug方面都處在同一水平線。以Meta為例,由于VR頭顯設(shè)
  • 游戲玩家才是最“元宇宙”的

    01元宇宙的概念,最早由科幻作家尼爾·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一個(gè)脫胎于現(xiàn)實(shí)世界,又與現(xiàn)實(shí)世界平行、相互影響,并且始終在線的虛擬世
  • 字節(jié)跳動(dòng),剛剛投了一位虛擬女生

    今年第一筆虛擬人融資出爐了。投資界獲悉,杭州李未可科技有限公司顯示發(fā)生股東變更,新增字節(jié)跳動(dòng)關(guān)聯(lián)公司北京量子躍動(dòng)科技有限公司。今天公司方面正式確認(rèn),本輪
  • 智能人機(jī)交互技術(shù)的春晚大考

    1月初的一個(gè)早晨,京東智能客戶服務(wù)產(chǎn)品部緊急開會(huì),進(jìn)行關(guān)于尚未對外公布的“X項(xiàng)目”的初討論。1月5日,這個(gè)神秘的X項(xiàng)目對外公布,京東成為央視2022年春晚獨(dú)家互動(dòng)合
  • DAO登上了歷史舞臺(tái),但是主流準(zhǔn)備好采用DAO了嗎?

    Block-807DAO要么是定義虛擬未來、無領(lǐng)導(dǎo)組織的革命性概念,要么是充滿存在主義和自我毀滅挑戰(zhàn)的反烏托邦結(jié)構(gòu),取決于你在與誰交談。近幾個(gè)月來, DAO已經(jīng)從Crypto
  • NFT 技術(shù)將傳世之作帶入博物館

    意大利四大博物館已與一個(gè)項(xiàng)目合作,該項(xiàng)目將展示和銷售達(dá)芬奇、卡拉瓦喬、拉斐爾和莫迪利亞尼等人的杰作的 NFT復(fù)制品。該計(jì)劃采用了 科技公司Cincello的國際專
  • 音樂家如何利用NFTs來提高歌迷參與度

    "音樂是一種語言,不以特定的文字說話。它用情感說話,如果它在骨子里,它就在骨子里。" - Keith Richards音樂激勵(lì)著我們,使我們流淚,使我們充滿狂喜,并撫慰我們的靈魂
Top 主站蜘蛛池模板: 东乡族自治县| 凭祥市| 绩溪县| 万盛区| 郯城县| 兰溪市| 泗水县| 运城市| 翼城县| 陇西县| 岑巩县| 武冈市| 乌审旗| 年辖:市辖区| 南丰县| 阳城县| 疏勒县| 闻喜县| 灵宝市| 贵德县| 讷河市| 余姚市| 湘潭县| 吴川市| 永福县| 花莲县| 平利县| 高清| 油尖旺区| 新源县| 铜川市| 湛江市| 赤城县| 彩票| 普定县| 濉溪县| 甘泉县| 金溪县| 景宁| 抚州市| 邻水|