6 月 28 日消息,科技媒體 9to5Mac 昨日(6 月 27 日)發布博文,報道稱 macOS 應用 MacWhisper 在近期版本更新中,通過接入英偉達的 Parakeet 模型,轉錄速度飆升。
曾于 2023 年 2 月報道,開發者 Jordi Bruin 推出 MacWhisper 應用,主要基于 OpenAI 的 Whisper 轉錄模型,可以在本地完成音頻文件轉錄為文本的工作。
不過隨著 OpenAI 將重點轉向更具商業價值的 gpt-4o-transcribe 模型,Whisper 開始顯得有些過時,更快、更新的轉錄模型一次次超越 Whisper。
英偉達于上月宣布 Parakeet 模型,擁有 A100、H100、T4 或 V100 GPU 的硬件上,僅需 1 秒鐘就能轉錄 60 分鐘的音頻。
Parakeet 可以通過開源工具獲得,但問題在于,并非每個人都熟悉命令行界面或自定義模型部署,而用戶現在通過新版 MacWhisper,可以更輕松地使用該功能。
應用開發者 Jordi Bruin 表示:“得益于我們與 Argmax 團隊的協作,MacWhisper 現在支持 Parakeet 模型。為了展示這一變化的重大意義,請查看下面的 GIF,我們用不到 8 秒的時間轉錄并整理了一個 30 分鐘的播客!”
該媒體隨后用新版 MacWhisper 應用實測,一個 3 小時的 9to5Mac Happy Hour 播客節目,轉錄僅用了 1 分 22 秒。
本文鏈接:http://www.www897cc.com/showinfo-45-14266-0.html8 秒轉錄 30 分鐘播客:MacWhisper 應用接入英偉達 Parakeet 模型
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: Claude 全盤操控商店運營實驗:1 個月凈資產縮水 20%,Anthropic 仍看好 AI 接管經濟前景