4 月 13 日消息,谷歌 DeepMind 首席執(zhí)行官 Demis Hassabis 在由領(lǐng)英聯(lián)合創(chuàng)始人 Reid Hoffman 共同主持的播客節(jié)目 Possible 中透露,谷歌計劃將旗下的 Gemini AI 模型與 Veo 視頻生成模型進(jìn)行融合,以此提升 Gemini 對物理世界的理解能力。
Hassabis 表示:“我們從一開始就將 Gemini 這一基礎(chǔ)模型打造為多模態(tài)模型,因為我們有著構(gòu)建一個通用數(shù)字助手的愿景,這個助手能夠在現(xiàn)實世界中真正為你提供幫助。”
目前,整個 AI 行業(yè)正逐漸朝著“全能”模型的方向發(fā)展,這些模型能夠理解和整合多種媒體形式。谷歌最新的 Gemini 模型不僅可以生成圖像和文本,還能生成音頻;而 OpenAI 在 ChatGPT 中的默認(rèn)模型如今也能創(chuàng)建圖像,包括宮崎駿風(fēng)格的藝術(shù)作品。亞馬遜也宣布計劃在今年晚些時候推出一款“任意到任意”的模型。
據(jù)了解,這些“全能”模型需要大量的訓(xùn)練數(shù)據(jù),包括圖像、視頻、音頻、文本等。Hassabis 暗示,Veo 的視頻數(shù)據(jù)主要來源于谷歌旗下的 YouTube 平臺。他說道:“通過觀看大量的 YouTube 視頻,Veo 2 能夠了解世界的物理規(guī)律。”此前,谷歌曾向 TechCrunch 表示,其模型可能會根據(jù)與 YouTube 創(chuàng)作者達(dá)成的協(xié)議,使用“部分”YouTube 內(nèi)容進(jìn)行訓(xùn)練。據(jù)報道,該公司去年擴(kuò)大了服務(wù)條款的部分內(nèi)容,以便獲取更多數(shù)據(jù)來訓(xùn)練其 AI 模型。
本文鏈接:http://www.www897cc.com/showinfo-45-12241-0.html谷歌計劃融合 Gemini 與 Veo 模型,打造全能 AI 助手
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: AI 購物應(yīng)用 Nate 創(chuàng)始人被控欺詐:人工冒充 AI 騙取 5000 萬美元投資
下一篇: 英偉達(dá)發(fā)布 Llama-3.1-Nemotron-Ultra-253B-v1 模型,推動 AI 高效部署