在百度AI DAY的盛會上,文小言迎來了品牌的全面煥新與功能的重磅升級。此次升級,文小言不僅引入了百度自研的文心大模型X1和4.5,還整合了滿血版DeepSeek-R1、可靈等第三方模型,實現(xiàn)了多模型的融合調(diào)度。
更文小言此番還推出了全新的語音大模型、圖片問答、AI生成圖片與視頻等一系列創(chuàng)新功能,為用戶帶來了更加豐富多樣的使用體驗。用戶現(xiàn)在可以選擇“自動模式”,一鍵調(diào)用最優(yōu)模型組合,無需再為不同任務(wù)頻繁切換模型。當(dāng)然,如果用戶有特定需求,依然可以選擇使用單一的DeepSeek或文心大模型。
百度AI產(chǎn)品創(chuàng)新業(yè)務(wù)負(fù)責(zé)人薛蘇表示,AI的未來已經(jīng)超越了單純的技術(shù)參數(shù)競爭,而是聚焦于如何通過多模型的協(xié)同工作,為用戶創(chuàng)造真正的價值。文小言致力于打造一個開放的生態(tài),整合頂尖的模型能力,從而推出更強(qiáng)大、更簡潔的AI產(chǎn)品。
在實際測試中,文小言展現(xiàn)出了強(qiáng)大的功能。當(dāng)使用文心大模型X1來設(shè)計一款吉卜力風(fēng)格的帆布包時,它能夠準(zhǔn)確解析風(fēng)格特點(diǎn),并連續(xù)調(diào)用AI繪圖工具,快速生成帆布包的正反面效果圖。而文心4.5的多模態(tài)分析能力,則能精準(zhǔn)識別出照片中的地理位置、背景建筑等城市特點(diǎn)。
文小言還支持在拍攝過程中直接用語音提問,能夠自動拍攝并識別語音進(jìn)行回答。在圖片問答的基礎(chǔ)上,文小言還能基于原圖進(jìn)行一鍵二次創(chuàng)作,例如上傳一張水杯的照片,就能設(shè)計出同款的抱枕和鼠標(biāo)墊。不過,當(dāng)原圖元素過于復(fù)雜時,仍可能出現(xiàn)文字拼寫錯誤或主體不一致的問題。
文小言還整合了百度的拍照搜題功能,用戶只需在拍攝界面選擇“解題老師”,就能自動調(diào)用百度教育長期積累的資源,很多題目還配備了視頻版數(shù)字人講解。同時,文小言還支持重慶、廣西、河南、廣東、山東等特色方言對話,并能切換多種音色,如蠟筆小新、孫悟空、熊大熊二等,既能處理復(fù)雜知識問答,也能在角色扮演中隨時中斷。
據(jù)百度語音首席架構(gòu)師賈磊透露,文小言此次推出的語音大模型是業(yè)界首個基于全新互相關(guān)注意力機(jī)制的端到端語音語言大模型,其調(diào)用成本比行業(yè)平均水平降低了50%-90%,推理響應(yīng)速度極快,將用戶等待時長縮短至約1秒。雖然目前暫不支持圖生圖功能,但文小言已經(jīng)融合了文生圖、AI修圖、AI視頻生成以及“圖個冷知識”等科普解讀向的新功能。
在談及文小言的商業(yè)模式時,薛蘇表示,過早進(jìn)行商業(yè)化探索或在用戶基礎(chǔ)不穩(wěn)定的情況下進(jìn)行商業(yè)化嘗試,可能會對產(chǎn)品造成損失。因此,目前文小言將全面擁抱免費(fèi)策略,并專注于提升用戶體驗,這是他們的首要任務(wù)。
本文鏈接:http://www.www897cc.com/showinfo-45-11827-0.html文小言煥新升級:一鍵生成吉卜力風(fēng),語音大模型與圖片問答亮點(diǎn)多多
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com