日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 手機

小米開源聲音理解大模型MiDashengLM-7B,22項評測刷新SOTA記錄

來源: 責編: 時間:2025-08-05 09:21:54 13觀看
導讀小米公司近期宣布了一項重大技術進展,正式開源了其聲音理解大模型MiDashengLM-7B。這一模型在多模態大模型領域取得了顯著成就,刷新了22個公開評測集上的最佳成績(SOTA),并展示了業界領先的推理效率和數據吞吐能力。MiDash

小米公司近期宣布了一項重大技術進展,正式開源了其聲音理解大模型MiDashengLM-7B。這一模型在多模態大模型領域取得了顯著成就,刷新了22個公開評測集上的最佳成績(SOTA),并展示了業界領先的推理效率和數據吞吐能力。0M728資訊網——每日最新資訊28at.com

MiDashengLM-7B的構建基于Xiaomi Dasheng音頻編碼器和Qwen2.5-Omni-7B Thinker自回歸解碼器,通過創新的通用音頻描述訓練策略,實現了對語音、環境聲音及音樂的統一理解。這一能力使得模型不僅能準確捕捉并分析聲音內容,還能理解其背后的情境與情感,提升了全場景智能生態的用戶體驗。0M728資訊網——每日最新資訊28at.com

0M728資訊網——每日最新資訊28at.com

據悉,小米于2024年首次推出了Xiaomi Dasheng聲音基座模型,而此次開源的7B模型是對該基座模型的擴展與升級。目前,該系列模型已在小米智能家居、汽車座艙等多個領域實現了超過30個應用場景的落地。0M728資訊網——每日最新資訊28at.com

在性能表現上,MiDashengLM-7B在音頻描述、聲音理解、音頻問答等多個任務中展現出了明顯的優勢。特別是在音頻描述任務中,其性能超越了Qwen和Kimi等同類7B模型。在聲音理解任務中,MiDashengLM-7B也僅在少數項目上略微落后于Kimi的7B模型,整體表現領先。0M728資訊網——每日最新資訊28at.com

除了卓越的性能表現,MiDashengLM-7B在推理效率上也實現了顯著提升。在單個樣本推理的情形下,其首個token預測時間(TTFT)僅為Qwen2.5-Omni-7B的1/4。同時,在批次處理時,MiDashengLM-7B能夠在80GB GPU上處理更大的batch size,而不會出現顯存溢出的問題,從而提高了數據吞吐效率。0M728資訊網——每日最新資訊28at.com

MiDashengLM-7B還采用了創新的訓練范式,即通用音頻描述對齊范式。這一范式避免了傳統ASR轉錄數據對齊方法的局限性,能夠捕捉說話人的情感、空間混響等關鍵聲學特征,迫使模型學習音頻場景的深層語義關聯。這一方法的引入,使得模型能夠利用幾乎所有的數據,包括噪聲或非語音內容,從而提高了數據利用率和模型性能。0M728資訊網——每日最新資訊28at.com

小米表示,音頻理解是構建全場景智能生態的關鍵領域之一。MiDashengLM-7B的推出,將進一步提升小米設備在自然語言交互方面的體驗,從智能家居、智能汽車到智能手機等各個領域都能受益。未來,小米將繼續致力于AI大模型領域的研究和創新,為用戶提供更加智能、便捷的服務。0M728資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-22-175643-0.html小米開源聲音理解大模型MiDashengLM-7B,22項評測刷新SOTA記錄

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OPPO Find X9 Ultra或配1.5K直屏,SM8850超大杯機型測試進展曝光

下一篇: iOS 18.6續航實測:iPhone 15系列續航提升明顯,值得升級

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 陕西省| 尼勒克县| 鄂托克前旗| 宝丰县| 焉耆| 穆棱市| 扶沟县| 分宜县| 卓资县| 平武县| 黄浦区| 调兵山市| 甘洛县| 吉安县| 吉隆县| 大余县| 白朗县| 米林县| 金平| 饶河县| 天门市| 类乌齐县| 勐海县| 偏关县| 宁安市| 奈曼旗| 宜春市| 栾城县| 达拉特旗| 宣化县| 辽宁省| 浑源县| 吴桥县| 通海县| 武城县| 仪征市| 麦盖提县| 策勒县| 拜泉县| 普兰县| 苍南县|