在杭州舉辦的螞蟻技術開放日上,螞蟻集團宣布了一項重大技術突破——開源理解與生成統一多模態大模型Ming-lite-omni。這一創新模型將理解和生成功能集于一身,不僅能夠同時處理這兩項任務,還能獨立運作,為用戶提供前所未有的全模態交互體驗。
據螞蟻集團基礎智能負責人西亭介紹,Ming-lite-omni具有三大顯著創新點。首先,它首次將理解和生成模型整合進一個框架內,實現了前所未有的統一。其次,該模型支持全模態輸入和輸出,無論是音視頻、圖像還是文字,都能輕松應對。最后,Ming-lite-omni采用了MoE架構,保證了模型的強大交互性,沒有添加任何額外的中間環節。
西亭進一步透露,團隊致力于打造一個能夠媲美GPT-4o的開源全模態模型。盡管GPT-4o是一個閉源模型,但螞蟻團隊設定了高標準,希望Ming-lite-omni能夠接近其交互能力,并完全開源,供全球開發者使用。
在開放日活動上,阿里集團副總裁、全球頂尖AI科學家許主洪也發表了演講。他指出,當前多模態大模型的一個重要發展趨勢是使用統一的框架來處理理解和生成任務。這一領域仍處于初級階段,需要更多的實踐驗證。Ming-lite-omni正是這一趨勢下的代表性實踐之一。
面對統一理解與生成的多模態大模型所帶來的技術挑戰,螞蟻團隊展現了強大的創新力。全模態交互的公開單模型在市場上非常罕見,而圖像和語意的理解與生成統一模型更是寥寥無幾,且效果難以平衡。Ming-lite-omni的出現,無疑為這一領域注入了新的活力。
螞蟻集團之所以選擇在此時開源Ming-lite-omni,西亭表示,這是受到業界開源精神的啟發,旨在回饋社區。他強調,簡潔而統一是技術之美,Ming-lite-omni正是將多模態的復雜性以更簡潔的形式呈現。對于螞蟻的AGI事業部來說,最好的AGI就是最好的產品,而用戶選擇一款模型的理由,正是其卓越的智能能力。
除了Ming-lite-omni,螞蟻集團今年還開源了多款模型,包括Ling-lite-1.5語言大模型、推理模型Ring-lite-1.5和Ring-lite-linear。這些模型在各自領域都取得了顯著成果,進一步提升了螞蟻在AI領域的影響力。
在行業大模型方面,螞蟻集團也取得了新進展。其AI健康管家即將上線新版本,通過高質量數據資源和專業標注團隊的優化,將為用戶提供更專業的健康服務。這一應用與衛健委合作開發,主打“AI就醫助理”、“AI健康咨詢”和“AI家庭醫生顧問”三大功能,旨在成為用戶的健康助理。
螞蟻集團在527技術開放日上公布的一系列大模型新進展,不僅展示了其在AGI時代的創新實力,也體現了其將挑戰轉化為機遇的決心。通過不斷追求智能能力的上限,螞蟻AGI團隊正在打造統一多模態的AGI產品,并加速開源步伐,聯合社區力量共同推進大模型產業的發展。
本文鏈接:http://www.www897cc.com/showinfo-45-13243-0.html螞蟻開源Ming-lite-omni,打造理解與生成一體化的全模態大模型
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com