日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

英偉達 Parakeet TDT 0.6B 成開源 ASR 模型新王:1 秒 AI 轉錄 60 分鐘音頻,字錯率低至 6.05%

來源: 責編: 時間:2025-05-08 17:51:06 64觀看
導讀 5 月 7 日消息,科技媒體 marktechpost 昨日(5 月 6 日)發布博文,報道稱英偉達最新推出 Parakeet TDT 0.6B,是一款先進的自動語音識別(ASR)模型,已在 Hugging Face 平臺上完全開源。Parakeet TDT 0.6B 的核心優勢在于

5 月 7 日消息,科技媒體 marktechpost 昨日(5 月 6 日)發布博文,報道稱英偉達最新推出 Parakeet TDT 0.6B,是一款先進的自動語音識別(ASR)模型,已在 Hugging Face 平臺上完全開源。THe28資訊網——每日最新資訊28at.com

Parakeet TDT 0.6B 的核心優勢在于其無與倫比的速度和轉錄質量。該模型僅需 1 秒即可處理 60 分鐘音頻,是現有主流開源 ASR 典型模型速度的 50 倍。THe28資訊網——每日最新資訊28at.com

在 Hugging Face 的 Open ASR Leaderboard 上,其字錯率(WER)低至 6.05%,成為開源模型中的佼佼者。這一性能為實時轉錄、語音分析、呼叫中心智能和音頻內容索引等企業級應用提供了強大支持。THe28資訊網——每日最新資訊28at.com

THe28資訊網——每日最新資訊28at.com

該模型基于 Transformer 架構,結合高質量轉錄數據進行微調,并針對英偉達硬件優化推理。THe28資訊網——每日最新資訊28at.com

援引博文介紹,該模型關鍵特性包括:6 億參數的編碼-解碼結構、量化和融合內核以提升推理效率、支持 TDT(Transducer Decoder Transformer)架構,以及精確的時間戳、數字格式化和標點恢復功能。THe28資訊網——每日最新資訊28at.com

此外,該模型還開創性地支持歌曲轉歌詞轉錄,這一罕見功能拓展了音樂索引和媒體平臺的用例,依托英偉達的 TensorRT 和 FP8 量化技術,其實時率(Real Time Factor,RTF,模型處理時間和音頻長度的比值)達到 3386。THe28資訊網——每日最新資訊28at.com

Parakeet TDT 0.6B 不僅關注速度和精度,還內置了多項獨特功能。該模型能將歌曲內容轉為歌詞,適用于音樂和媒體領域;支持數字和時間戳格式化,提升會議記錄、法律轉錄和醫療記錄的可讀性;標點恢復功能則增強了下游自然語言處理(NLP)應用的表現。這些特性大幅提升轉錄質量,減輕后期處理或人工編輯的負擔,尤其適合企業級部署。THe28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12737-0.html英偉達 Parakeet TDT 0.6B 成開源 ASR 模型新王:1 秒 AI 轉錄 60 分鐘音頻,字錯率低至 6.05%

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 谷歌推 I O 版 Gemini 2.5 Pro 模型,AI 助力前端開發與復雜編程

下一篇: “活化”敦煌 IP:商湯科技與敦煌當代美術館達成戰略合作

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 青神县| 荔波县| 乡宁县| 西昌市| 漳平市| 阳江市| 手机| 泾阳县| 永德县| 会东县| 米泉市| 通化县| 双柏县| 霸州市| 隆昌县| 通渭县| 葫芦岛市| 南阳市| 罗江县| 舟曲县| 黑水县| 洛川县| 沅陵县| 稻城县| 漳浦县| 龙游县| 成安县| 阿拉善盟| 阿尔山市| 从江县| 芜湖市| 乐亭县| 汉寿县| 曲周县| 化州市| 霍邱县| 若羌县| 辽宁省| 河池市| 漾濞| 富锦市|