5 月 31 日消息,谷歌 DeepMind 團隊于 5 月 27 日宣布推出 SignGemma,是其迄今為止最強大的手語翻譯模型,可將手語轉化為口語文本,該開源模型將于今年晚些時候加入 Gemma 模型家族。
注:SignGemma 模型支持多語言功能,但目前主要針對美國手語(ASL)和英語進行了深度優化,開源屬性意味著開發者可以自由使用并改進它。
DeepMind 希望通過這一技術,打破手語使用者在溝通上的障礙,讓他們在工作、學習和社交中更順暢地參與。
DeepMind 今年還推出 Gemma 3n 模型,支持從音頻、圖像、視頻及文本輸入生成智能文本,助力開發者打造實時互動應用。
此外,谷歌還與佐治亞理工學院及 Wild Dolphin Project 合作,推出 DolphinGemma 模型,分析并生成海豚聲音,基于巴哈馬大西洋斑點海豚的長期研究數據構建。
同時,MedGemma 模型作為 Gemma 3 家族新成員,聚焦醫療 AI,支持臨床推理和醫學影像分析,加速醫療與人工智能的融合創新。
本文鏈接:http://www.www897cc.com/showinfo-45-13337-0.html谷歌 DeepMind 最強 AI 手語翻譯模型:SignGemma 登場,打破手語溝通壁壘
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com