5 月 31 日消息,谷歌 DeepMind 團隊于 5 月 27 日宣布推出 SignGemma,是其迄今為止最強大的手語翻譯模型,可將手語轉(zhuǎn)化為口語文本,該開源模型將于今年晚些時候加入 Gemma 模型家族。
注:SignGemma 模型支持多語言功能,但目前主要針對美國手語(ASL)和英語進行了深度優(yōu)化,開源屬性意味著開發(fā)者可以自由使用并改進它。
DeepMind 希望通過這一技術(shù),打破手語使用者在溝通上的障礙,讓他們在工作、學(xué)習(xí)和社交中更順暢地參與。
DeepMind 今年還推出 Gemma 3n 模型,支持從音頻、圖像、視頻及文本輸入生成智能文本,助力開發(fā)者打造實時互動應(yīng)用。
此外,谷歌還與佐治亞理工學(xué)院及 Wild Dolphin Project 合作,推出 DolphinGemma 模型,分析并生成海豚聲音,基于巴哈馬大西洋斑點海豚的長期研究數(shù)據(jù)構(gòu)建。
同時,MedGemma 模型作為 Gemma 3 家族新成員,聚焦醫(yī)療 AI,支持臨床推理和醫(yī)學(xué)影像分析,加速醫(yī)療與人工智能的融合創(chuàng)新。
本文鏈接:http://www.www897cc.com/showinfo-45-13337-0.html谷歌 DeepMind 最強 AI 手語翻譯模型:SignGemma 登場,打破手語溝通壁壘
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 谷歌聯(lián)合創(chuàng)始人 Sergey Brin 揭秘:AI 愛吃“罰酒”,受威脅后反而提升性能