近日,科技巨頭谷歌在人工智能領(lǐng)域再掀波瀾,緊隨Open AI的密集發(fā)布步伐,于深夜震撼推出其最新力作——Gemini2.0 AI模型。谷歌宣稱,Gemini2.0不僅是其迄今為止最尖端、功能最全面的AI模型,更是業(yè)界首個(gè)實(shí)現(xiàn)原生多模態(tài)輸入輸出的創(chuàng)新之作。
Gemini2.0的問世,標(biāo)志著谷歌在AI技術(shù)上的重大突破。在此之前,谷歌發(fā)布的Gemini-exp-1206模型已憑借處理200萬個(gè)標(biāo)記(相當(dāng)于一個(gè)多小時(shí)的視頻)的卓越能力,在Livebench上名列前茅,僅次于OpenAI的o1-preview,超越Claude 3.5 Sonnet,引發(fā)了業(yè)界的廣泛關(guān)注與猜測。而Gemini2.0的真正亮相,更是將這些期待推向了新的高度。
在性能上,Gemini2.0實(shí)現(xiàn)了全面升級(jí)。其處理速度較上一代旗艦產(chǎn)品Gemini 1.5 Pro提升了整整兩倍,為用戶帶來了更為高效的處理能力和更快的響應(yīng)時(shí)間。更為引人注目的是,Gemini2.0支持圖片、視頻和音頻等多模態(tài)輸入與輸出,能夠直接生成圖像與文本混合的內(nèi)容,以及原生生成可控的多語言文本轉(zhuǎn)語音(TTS)音頻。它還能無縫調(diào)用Google Search、代碼執(zhí)行及第三方用戶自定義函數(shù)等工具,展現(xiàn)了前所未有的靈活性和實(shí)用性。
基于Gemini2.0的強(qiáng)大架構(gòu),谷歌進(jìn)一步推出了三款全新的AI智能體原型:通用大模型助手Project Astra、瀏覽器助手Project Mariner以及編程助手Jules。這些智能體的問世,標(biāo)志著谷歌AI正逐步邁向“Agent”時(shí)代的新篇章。
Project Astra作為谷歌AI助手的旗艦產(chǎn)品,具備實(shí)時(shí)語音和視覺處理能力,能夠通過手機(jī)或谷歌眼鏡進(jìn)行跨文本、音頻、視頻的多模態(tài)實(shí)時(shí)推理。此次升級(jí)后的Astra在對話理解、工具調(diào)用、記憶能力和響應(yīng)速度等方面均實(shí)現(xiàn)了顯著提升。它不僅能夠更好地理解不同口音和不常見詞匯,還能借助Gemini 2.0調(diào)用Google搜索、鏡頭和地圖等功能,成為用戶日常生活中的得力助手。
Project Mariner則是一個(gè)旨在探索人機(jī)交互未來的瀏覽器助手。它能夠理解和推理瀏覽器屏幕上的信息,包括像素、文本、代碼、圖像和表單等網(wǎng)絡(luò)元素,并通過實(shí)驗(yàn)性的Chrome擴(kuò)展程序使用這些信息完成任務(wù)。從登錄雜貨店網(wǎng)站購物到查找航班和酒店、購買家居用品、查找食譜等,Mariner都能輕松應(yīng)對。在WebVoyager基準(zhǔn)測試中,Mariner作為單一代理設(shè)置實(shí)現(xiàn)了83.5%的最佳工作結(jié)果。
Jules則是專為編程人員打造的AI助手。它直接集成到GitHub工作流程中,能夠查看用戶已有的代碼并直接在GitHub中進(jìn)行更改,解決開發(fā)者在修改bug時(shí)遇到的難題。這一切都在用戶的監(jiān)督之下進(jìn)行,既保證了安全性又節(jié)省了時(shí)間。
Gemini2.0還在游戲、學(xué)術(shù)研究、機(jī)器人等領(lǐng)域展開了嘗試。谷歌與Supercell等游戲開發(fā)商合作,探索智能體在游戲中的應(yīng)用;推出的Deep Research則如同學(xué)術(shù)研究助手,通過高級(jí)推理和長上下文能力直接生成論文;谷歌還計(jì)劃將Gemini 2.0的空間推理能力應(yīng)用于機(jī)器人身上,推動(dòng)機(jī)器人的智能化進(jìn)程。
為了防止濫用,谷歌使用SynthID技術(shù)對所有生成的音頻和圖像進(jìn)行水印標(biāo)記。同時(shí),谷歌還推出了多模態(tài)實(shí)時(shí)API,幫助開發(fā)者構(gòu)建具有實(shí)時(shí)音頻和視頻流功能的應(yīng)用程序。這個(gè)API支持來自攝像頭或屏幕的音頻和視頻輸入,能夠處理自然對話模式。
Gemini2.0的強(qiáng)大性能得益于谷歌定制的硬件第六代TPU Trillium。與前代產(chǎn)品相比,Trillium在訓(xùn)練性能、推理吞吐量、峰值計(jì)算性能等方面均實(shí)現(xiàn)了顯著提升。目前,用戶已可以通過PC端優(yōu)先體驗(yàn)Gemini2.0 Flash實(shí)驗(yàn)版,而移動(dòng)版也將很快面世。
谷歌和Alphabet的首席執(zhí)行官桑達(dá)爾·皮查伊對Gemini2.0寄予厚望。他表示,如果Gemini 1.0是關(guān)于組織和理解信息的,那么Gemini 2.0就是為了讓信息更加有用。其中,“Agent”是人工智能時(shí)代下一個(gè)大方向。谷歌此次展示的系統(tǒng)級(jí)Copilot和智能體應(yīng)用,充分展現(xiàn)了Agent能夠?yàn)槿藗兩顜淼娜轿桓淖儭?span style="display:none">nyf28資訊網(wǎng)——每日最新資訊28at.com
隨著Gemini2.0的推出以及一系列AI智能體的問世,谷歌正加速將AI融入其所有產(chǎn)品中。未來,谷歌計(jì)劃將Gemini 2.0的先進(jìn)推理能力引入更多產(chǎn)品功能中,為用戶帶來更加智能、便捷的體驗(yàn)。
本文鏈接:http://www.www897cc.com/showinfo-45-11730-0.html谷歌Gemini2.0震撼發(fā)布,AI Agent時(shí)代正式拉開帷幕?
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com