日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

百川智能上線開源全模態模型 Omni-1.5,號稱多項能力超越 GPT-4o mini

來源: 責編: 時間:2025-01-28 08:57:22 71觀看
導讀 1 月 26 日消息,百川智能今日宣布,Baichuan-Omni-1.5 開源全模態模型正式上線。該模型不僅支持文本、圖像、音頻和視頻的全模態理解,還具備文本和音頻的雙模態生成能力。官方宣稱,其在視覺、語音及多模態流式處理

1 月 26 日消息,百川智能今日宣布,Baichuan-Omni-1.5 開源全模態模型正式上線。該模型不僅支持文本、圖像、音頻和視頻的全模態理解,還具備文本和音頻的雙模態生成能力。Qd128資訊網——每日最新資訊28at.com

官方宣稱,其在視覺、語音及多模態流式處理等方面,Baichuan-Omni-1.5 的表現均優于 GPT-4o mini;在多模態醫療應用領域,其具備更突出的領先優勢。Qd128資訊網——每日最新資訊28at.com

Baichuan-Omni-1.5 不僅能在輸入和輸出端實現多種交互操作,還擁有強大的多模態推理能力和跨模態遷移能力。Qd128資訊網——每日最新資訊28at.com

Qd128資訊網——每日最新資訊28at.com

其在音頻技術領域采用了端到端解決方案,可支持多語言對話、端到端音頻合成,還可實現自動語音識別、文本轉語音等功能,且支持音視頻實時交互。Qd128資訊網——每日最新資訊28at.com

據介紹,在視頻理解能力方面,Baichuan-Omni-1.5 通過對編碼器、訓練數據和訓練方法等多個關鍵環節進行深入優化,其整體性能大幅超越 GPT-4o-mini。Qd128資訊網——每日最新資訊28at.com

Qd128資訊網——每日最新資訊28at.com

Qd128資訊網——每日最新資訊28at.com

模型結構方面,Baichuan-Omni-1.5 的模型輸入部分支持各種模態通過相應的 Encoder / Tokenizer 輸入到大型語言模型中。Qd128資訊網——每日最新資訊28at.com

而在模型輸出部分,Baichuan-Omni-1.5 采用了文本-音頻交錯輸出的設計,通過 Text Tokenizer 和 Audio Decoder 同時生成文本和音頻。Qd128資訊網——每日最新資訊28at.com

百川智能構建了一個包含 3.4 億條高質量圖片 / 視頻-文本數據和近 100 萬小時音頻數據的龐大數據庫,且在 SFT 階段使用了 1700 萬條全模態數據。Qd128資訊網——每日最新資訊28at.com

附開源地址如下:Qd128資訊網——每日最新資訊28at.com

GitHub:Qd128資訊網——每日最新資訊28at.com

https://github.com/baichuan-inc/Baichuan-Omni-1.5Qd128資訊網——每日最新資訊28at.com

模型權重:Qd128資訊網——每日最新資訊28at.com

Baichuan-Omni-1.5:Qd128資訊網——每日最新資訊28at.com

https://huggingface.co/baichuan-inc/Baichuan-Omni-1d5Qd128資訊網——每日最新資訊28at.com

https://modelers.cn/models/Baichuan/Baichuan-Omni-1d5Qd128資訊網——每日最新資訊28at.com

Baichuan-Omni-1.5-Base:Qd128資訊網——每日最新資訊28at.com

https://huggingface.co/baichuan-inc/Baichuan-Omni-1d5-BaseQd128資訊網——每日最新資訊28at.com

https://modelers.cn/models/Baichuan/Baichuan-Omni-1d5-BaseQd128資訊網——每日最新資訊28at.com

技術報告:Qd128資訊網——每日最新資訊28at.com

https://github.com/baichuan-inc/Baichuan-Omni-1.5/blob/main/baichuan_omni_1_5.pdfQd128資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-10216-0.html百川智能上線開源全模態模型 Omni-1.5,號稱多項能力超越 GPT-4o mini

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: Hugging Face 推出號稱“世界上最小的視覺語言模型”SmolVLM-256M

下一篇: 印度首富計劃建設“世界最大”數據中心,預計投資 200~300 億美元

標簽:
  • 熱門焦點
  • 三院士三教授熱聊元宇宙&——AIGC,學術界怎么看?

    來源:清元宇宙在近日舉辦的中國江寧2023元宇宙產業·人才高峰論壇暨AIGC發展大會上,中國工程院院士譚建榮、劉韻潔、鄭緯民出席并發表了主旨演講。除了三大院士,還有清華
  • FMIFAwards獎項即將揭曉!

    來源:X增強現實FMIF Awards未來元宇宙創新獎是由未來元宇宙創新論壇、ARinChina以及多家投資機構、媒體、研究院聯合發起的一項評選活動。旨在推動新技術的融合與集成低成本
  • 2022 區塊鏈 50 強榜單;垃圾NFT項目的十三個特性

    本期關鍵字TerraZero在Decentraland完成元宇宙住房抵押貸款;騰訊發行齊白石畫作數字藏品;Ripple成為數字歐元協會成員;Gem上線稀有度排名功能;2022 區塊鏈 50 強榜
  • 高通成立歐洲XR實驗室;ICICB計劃進軍元宇宙......

    擴展現實(XR)通過計算機將真實與虛擬相結合,打造了一個可人機交互的虛擬環境,將AR、VR、MR多種技術相融合,為體驗者帶來了虛擬世界與現實世界之間無縫轉換的“沉浸
  • Meta、谷歌、微軟競相涌入元宇宙,小型企業該如何伺機而動?

    目前來看元宇宙不會影響到小型企業的發展,但在接下來的十年內可能會發生很多變化。很多有商業頭腦的企業家都在密切關注著元宇宙的發展。元宇宙這個詞,你一定或
  • 傳統互聯網與區塊鏈場景下數據權利法律分析

    數據權益的復雜性在于數據涉及多環節多主體、內容不同質且與不同場景緊密聯系、對軟硬件技術環節緊密相關等方面的復雜性。在傳統互聯網與區塊鏈模式下,數據處
  • MR——元宇宙平臺的下一代入口

    作為“元宇宙”的領頭羊,Meta的一舉一動都受到業內的高度關注。華爾街見聞提及,2月17日周四,Facebook母公司Meta在透露,其混合現實技術(MR)將在幾年后實現,讓人們對元
  • Staking 收益翻倍?

    以太坊質押可能很快就會有兩倍的利潤。Coinbase 估計,在 1 月份以太坊網絡合并后,持有 ETH 的回報將翻倍。增長預期假設來自加密貨幣交易所 Coinbase 的估計是準
  • 元宇宙+劇本殺:“在異世界里當演員”

    你玩過劇本殺嗎?體驗過“元宇宙+劇本殺”嗎?2月,恒信東方推出了一款次時代劇本殺原創作品——《失落的王朝》。其劇本和線索以數字化資產打造,通過VR技術塑造了與
Top 主站蜘蛛池模板: 德州市| 香港 | 青川县| 开鲁县| 定兴县| 武安市| 石棉县| 瓦房店市| 崇左市| 通榆县| 广河县| 大庆市| 息烽县| 彩票| 乡宁县| 资中县| 都匀市| 纳雍县| 同心县| 图木舒克市| 杭锦后旗| 葵青区| 攀枝花市| 莎车县| 宝鸡市| 祁东县| 高密市| 徐州市| 景东| 阿合奇县| 富平县| 东乡县| 涟源市| 涡阳县| 迁西县| 远安县| 邯郸市| 珲春市| 昌邑市| 黑水县| 和静县|