日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 科技  > 網(wǎng)絡(luò)

每10份音頻就有8份被胡編 OpenAI語音轉(zhuǎn)錄工具被曝存重大缺陷

來源: 責(zé)編: 時(shí)間:2024-10-29 08:07:32 85觀看
導(dǎo)讀 生成式人工智能領(lǐng)域的領(lǐng)軍者OpenAI,曾吹噓其人工智能轉(zhuǎn)錄工具Whisper具有接近 “人類水平的穩(wěn)定性和準(zhǔn)確性”。然而,隨著該轉(zhuǎn)錄工具在各行各業(yè)被越來越多地普及使用,其問題似乎也正開始凸顯—&

生成式人工智能領(lǐng)域的領(lǐng)軍者OpenAI,曾吹噓其人工智能轉(zhuǎn)錄工具Whisper具有接近 “人類水平的穩(wěn)定性和準(zhǔn)確性”。EDg28資訊網(wǎng)——每日最新資訊28at.com

然而,隨著該轉(zhuǎn)錄工具在各行各業(yè)被越來越多地普及使用,其問題似乎也正開始凸顯——根據(jù)業(yè)內(nèi)媒體對十多位軟件工程師、開發(fā)人員和學(xué)術(shù)研究人員的采訪,如今Whisper所存在的一個(gè)重大缺陷已愈發(fā)不容忽視:它很容易會編造大段文字,甚至是整段句子。EDg28資訊網(wǎng)——每日最新資訊28at.com

這些業(yè)內(nèi)專家表示,一些編造出的文字——在行業(yè)內(nèi)被稱為“幻覺”,可能包括種族言論、暴力措辭,乃至完全杜撰出的醫(yī)療建議。EDg28資訊網(wǎng)——每日最新資訊28at.com

專家們越來越擔(dān)心這種“胡編亂造”可能造成嚴(yán)重后果,因?yàn)閃hisper當(dāng)前正被全球多個(gè)行業(yè)用于翻譯和轉(zhuǎn)錄采訪內(nèi)容、生成文本以及為視頻制作字幕。EDg28資訊網(wǎng)——每日最新資訊28at.com

雖然OpenAI曾警告不應(yīng)在“高風(fēng)險(xiǎn)領(lǐng)域”使用該工具,但目前一些美國醫(yī)療中心都正開始使用基于Whisper的工具,來記錄患者與醫(yī)生間的對話。EDg28資訊網(wǎng)——每日最新資訊28at.com

據(jù)經(jīng)常使用Whisper的研究人員和工程師表示,他們在工作中經(jīng)常會遇到該工具出現(xiàn)“幻覺”。例如,密歇根大學(xué)的一名研究人員在研究公共會議的轉(zhuǎn)錄準(zhǔn)確率時(shí)發(fā)現(xiàn),他所審核的每十份音頻轉(zhuǎn)錄中,便有八份存在“幻覺”。EDg28資訊網(wǎng)——每日最新資訊28at.com

一位機(jī)器學(xué)習(xí)工程師則稱,在他分析的100多個(gè)小時(shí)的Whisper轉(zhuǎn)錄中,他初發(fā)現(xiàn)大約有一半存在“幻覺”。第三位開發(fā)人員指出,在他用Whisper創(chuàng)建的26000份記錄中,幾乎每一份都發(fā)現(xiàn)了胡編亂造的現(xiàn)象。EDg28資訊網(wǎng)——每日最新資訊28at.com

即使是在那些錄制良好的簡短音頻樣本里,問題也依然存在。在近的一項(xiàng)研究中,計(jì)算機(jī)科學(xué)家們在審查的超過13000個(gè)清晰音頻片段中發(fā)現(xiàn)有187個(gè)存在“幻覺”問題。EDg28資訊網(wǎng)——每日最新資訊28at.com

研究人員表示,這種趨勢將導(dǎo)致在數(shù)百萬段錄音中出現(xiàn)數(shù)以萬計(jì)的錯(cuò)誤轉(zhuǎn)錄。EDg28資訊網(wǎng)——每日最新資訊28at.com

每10份音頻就有8份被胡編 OpenAI語音轉(zhuǎn)錄工具被曝存重大缺陷EDg28資訊網(wǎng)——每日最新資訊28at.com

后果嚴(yán)重EDg28資訊網(wǎng)——每日最新資訊28at.com

曾在拜登政府領(lǐng)導(dǎo)白宮科技政策辦公室工作的Alondra Nelson表示,這種錯(cuò)誤可能會造成“非常嚴(yán)重的后果”,尤其是在醫(yī)院里。EDg28資訊網(wǎng)——每日最新資訊28at.com

目前,包括明尼蘇達(dá)州的曼卡托診所和洛杉磯兒童醫(yī)院在內(nèi)的超過30000名臨床醫(yī)生和40個(gè)衛(wèi)生系統(tǒng),已開始使用法國AI診療公司Nabla基于Whisper打造的工具。EDg28資訊網(wǎng)——每日最新資訊28at.com

Nabla公司的首席技術(shù)官M(fèi)artin Raison表示,該工具根據(jù)醫(yī)學(xué)語言進(jìn)行了微調(diào),以轉(zhuǎn)錄和總結(jié)醫(yī)生與病人間的互動(dòng)。該工具轉(zhuǎn)錄的就診記錄目前已多達(dá)約700萬次。該公司官員還指出,他們知道Whisper會產(chǎn)生幻覺,并正在努力解決這個(gè)問題。EDg28資訊網(wǎng)——每日最新資訊28at.com

目前擔(dān)任普林斯頓高等研究院教授的Nelson表示,“沒有人希望出現(xiàn)誤診。(該領(lǐng)域)應(yīng)該有更高的標(biāo)準(zhǔn)。”EDg28資訊網(wǎng)——每日最新資訊28at.com

目前,Whisper還被用于為聾人和聽力障礙者制作字幕——這是一個(gè)特別容易因出現(xiàn)錯(cuò)誤轉(zhuǎn)錄而陷入困境的人群,因?yàn)槊@人和聽力障礙者完全無法識別“隱藏在所有文本中”的編造內(nèi)容。EDg28資訊網(wǎng)——每日最新資訊28at.com

這種幻覺在Whisper中的普遍存在,已促使眾多專家、倡導(dǎo)者和OpenAI前員工呼吁美國政府考慮制定人工智能法規(guī)。EDg28資訊網(wǎng)——每日最新資訊28at.com

他們指出,OpenAI至少需要解決這一缺陷。今年2月因擔(dān)心公司的發(fā)展方向而從OpenAI辭職的工程師William Saunders就表示,如果OpenAI愿意優(yōu)先解決這個(gè)問題,這個(gè)問題似乎是可以解決的。而如果你長期把它放在那里,而人們對它的功能過于自信,并把它集成到所有這些其他系統(tǒng)中,那就有麻煩了。EDg28資訊網(wǎng)——每日最新資訊28at.com

雖然大多數(shù)開發(fā)人員都認(rèn)為轉(zhuǎn)錄工具不可避免會拼錯(cuò)單詞或出現(xiàn)其他錯(cuò)誤,但不少工程師和研究人員表示,他們從未見過其他人工智能轉(zhuǎn)錄工具像Whisper一樣容易產(chǎn)生幻覺。EDg28資訊網(wǎng)——每日最新資訊28at.com

目前,該工具已被集成到OpenAI旗艦聊天機(jī)器人ChatGPT的某些版本中,同時(shí)也是甲骨文和微軟云計(jì)算平臺的內(nèi)置產(chǎn)品,為全球數(shù)千家公司提供服務(wù)。它還可用于將文本轉(zhuǎn)錄和翻譯成多種語言。EDg28資訊網(wǎng)——每日最新資訊28at.com

僅在上個(gè)月,開源人工智能平臺HuggingFace上的一個(gè)Whisper新版本就被下載了420多萬次。該平臺的機(jī)器學(xué)習(xí)工程師Sanchit Gandhi表示,Whisper是流行的開源語音識別模型,從呼叫中心到語音助手,都內(nèi)置了Whisper。EDg28資訊網(wǎng)——每日最新資訊28at.com

康奈爾大學(xué)教授Allison Koenecke和弗吉尼亞大學(xué)教授Mona Sloane,目前已研究了他們從卡內(nèi)基梅隆大學(xué)的研究資料庫TalkBank中獲得的數(shù)千個(gè)簡短音頻片段。他們發(fā)現(xiàn),近40%的幻聽是有害的或令人擔(dān)憂的,因?yàn)檎f話者的原意可能被曲解或歪曲。EDg28資訊網(wǎng)——每日最新資訊28at.com

研究人員并不確定Whisper和類似工具產(chǎn)生幻覺的原因,但軟件開發(fā)人員表示,這些胡編亂造往往發(fā)生在出現(xiàn)停頓、背景聲音或音樂播放時(shí)。OpenAI此前在網(wǎng)上披露的信息中曾建議,不要在決策情境中使用Whisper,因?yàn)闇?zhǔn)確性上的缺陷會導(dǎo)致結(jié)果上的明顯缺陷。EDg28資訊網(wǎng)——每日最新資訊28at.com

而針對新爆料,有OpenAI發(fā)言人回應(yīng)稱,OpenAI會在接下來的模型更新中加入相應(yīng)的反饋機(jī)制。EDg28資訊網(wǎng)——每日最新資訊28at.com

每10份音頻就有8份被胡編 OpenAI語音轉(zhuǎn)錄工具被曝存重大缺陷EDg28資訊網(wǎng)——每日最新資訊28at.com


文章出處:財(cái)聯(lián)社

本文鏈接:http://www.www897cc.com/showinfo-17-124867-0.html每10份音頻就有8份被胡編 OpenAI語音轉(zhuǎn)錄工具被曝存重大缺陷

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 特斯拉或被踢出科技七巨頭 華爾街正重新評估 奈飛成備選!

下一篇: 世紀(jì)大互通!京東物流接入天貓后 菜鳥全面接入京東平臺

標(biāo)簽:
  • 熱門焦點(diǎn)
Top 主站蜘蛛池模板: 响水县| 苍溪县| 巴林左旗| 读书| 长乐市| 秦安县| 江津市| 曲靖市| 洪江市| 铜山县| 凌海市| 大同县| 进贤县| 九江市| 巍山| 通河县| 铜鼓县| 铁岭市| 鄂伦春自治旗| 富平县| 镇原县| 乌兰浩特市| 松江区| 中江县| 阳新县| 梓潼县| 昌都县| 南安市| 克拉玛依市| 浦江县| 灯塔市| 彭山县| 江陵县| 佛教| 萨迦县| 永安市| 青川县| 图片| 永顺县| 禹州市| 泉州市|