在百度AI DAY的盛會上,文小言迎來了品牌的全面煥新與功能的重磅升級。此次升級,文小言不僅引入了百度自研的文心大模型X1和4.5,還整合了滿血版DeepSeek-R1、可靈等第三方模型,實現了多模型的融合調度。
更文小言此番還推出了全新的語音大模型、圖片問答、AI生成圖片與視頻等一系列創新功能,為用戶帶來了更加豐富多樣的使用體驗。用戶現在可以選擇“自動模式”,一鍵調用最優模型組合,無需再為不同任務頻繁切換模型。當然,如果用戶有特定需求,依然可以選擇使用單一的DeepSeek或文心大模型。
百度AI產品創新業務負責人薛蘇表示,AI的未來已經超越了單純的技術參數競爭,而是聚焦于如何通過多模型的協同工作,為用戶創造真正的價值。文小言致力于打造一個開放的生態,整合頂尖的模型能力,從而推出更強大、更簡潔的AI產品。
在實際測試中,文小言展現出了強大的功能。當使用文心大模型X1來設計一款吉卜力風格的帆布包時,它能夠準確解析風格特點,并連續調用AI繪圖工具,快速生成帆布包的正反面效果圖。而文心4.5的多模態分析能力,則能精準識別出照片中的地理位置、背景建筑等城市特點。
文小言還支持在拍攝過程中直接用語音提問,能夠自動拍攝并識別語音進行回答。在圖片問答的基礎上,文小言還能基于原圖進行一鍵二次創作,例如上傳一張水杯的照片,就能設計出同款的抱枕和鼠標墊。不過,當原圖元素過于復雜時,仍可能出現文字拼寫錯誤或主體不一致的問題。
文小言還整合了百度的拍照搜題功能,用戶只需在拍攝界面選擇“解題老師”,就能自動調用百度教育長期積累的資源,很多題目還配備了視頻版數字人講解。同時,文小言還支持重慶、廣西、河南、廣東、山東等特色方言對話,并能切換多種音色,如蠟筆小新、孫悟空、熊大熊二等,既能處理復雜知識問答,也能在角色扮演中隨時中斷。
據百度語音首席架構師賈磊透露,文小言此次推出的語音大模型是業界首個基于全新互相關注意力機制的端到端語音語言大模型,其調用成本比行業平均水平降低了50%-90%,推理響應速度極快,將用戶等待時長縮短至約1秒。雖然目前暫不支持圖生圖功能,但文小言已經融合了文生圖、AI修圖、AI視頻生成以及“圖個冷知識”等科普解讀向的新功能。
在談及文小言的商業模式時,薛蘇表示,過早進行商業化探索或在用戶基礎不穩定的情況下進行商業化嘗試,可能會對產品造成損失。因此,目前文小言將全面擁抱免費策略,并專注于提升用戶體驗,這是他們的首要任務。
本文鏈接:http://www.www897cc.com/showinfo-45-11827-0.html文小言煥新升級:一鍵生成吉卜力風,語音大模型與圖片問答亮點多多
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com