6 月 21 日消息,就在 GPT-4 因征服標準化測試而登上頭條時,微軟研究人員正在對其他 AI 模型進行一種非常另類的測試 —— 一種旨在讓模型捏造信息的測試。
為了治好這種被稱為“AI 幻覺”的癥狀,他們設(shè)定了一個會讓大多數(shù)人頭疼的文本檢索任務(wù),然后跟蹤并改進模型響應(yīng),這也是微軟在測定、檢測和緩解 AI 幻覺方面的一個例子。
微軟 AI 負責(zé)項目的首席產(chǎn)品官 Sarah Bird 表示,“微軟希望其所有 AI 系統(tǒng)都是值得信賴且可以有效使用的”。
我們可以向這個領(lǐng)域投入許多專家和資源,因此我們認為自己可以幫助闡明“應(yīng)該如何負責(zé)任地使用新型 AI 技術(shù)”的方法,并使其他人也能夠做到這一點。
從技術(shù)角度來講,AI 幻覺是一種“缺乏事實依據(jù)”的內(nèi)容,這意味著 AI 模型改變了它所給定的數(shù)據(jù)或添油加醋描述了原本不存在的信息。
當然,AI 幻覺這種東西也不是所有時候都毫無用處,例如當用戶希望 AI 幫自己寫一個科幻故事,或給出一種非傳統(tǒng)想法時,就屬于是有益的;但在大多數(shù)需要 AI 的場景,諸如醫(yī)學(xué)和教育等場景就顯得多余了,因為準確性大于一切。
因此,微軟也在努力根據(jù)其自有 AI 產(chǎn)品(例如 Copilot)來試圖攻克 AI 幻覺,研究一系列工具來幫助機器解決幻覺問題。
微軟表示,其工程師花了數(shù)月時間,通過檢索增強生成技術(shù)(一種無需重新訓(xùn)練模型即可向模型添加額外知識的技術(shù))將必應(yīng)搜索數(shù)據(jù)作為 Copilot 的依據(jù),通過必應(yīng)的答案、索引和排名數(shù)據(jù)幫助 Copilot 提供更準確、更相關(guān)的回復(fù),同時提供引用信息,讓用戶可以自行查找和驗證。
“該模型非常擅長推理信息,但我們不認為它應(yīng)該成為答案的來源,”Bird 說,“我們認為數(shù)據(jù)應(yīng)該是答案的來源,因此我們解決這個問題的第一步是向模型提供最新、高質(zhì)量且準確的數(shù)據(jù)。”
除此之外,微軟還試圖通過各種工具幫助客戶做到這一點,例如 Azure OpenAI 服務(wù)中的“Your Data”功能可幫助企業(yè)組織用自己的數(shù)據(jù)來訓(xùn)練生成式 AI。
值得一提的是,微軟還推出了一種實時工具,可以大規(guī)模檢測應(yīng)用中依據(jù)企業(yè)數(shù)據(jù)的可靠程度。微軟表示,AzureAI Studio可以根據(jù)來源文檔評估響應(yīng)的可靠程度。
據(jù)介紹,微軟還正在開發(fā)一種新的針對措施,可以實時屏蔽和糾正“毫無根據(jù)”的信息。當檢測到事實依據(jù)錯誤時,該功能將根據(jù)數(shù)據(jù)自動進行重寫。
微軟 AI負責(zé)項目的首席產(chǎn)品經(jīng)理 Ken Archer 表示,“處于生成式 AI 的前沿意味著我們有責(zé)任和機會讓自己的產(chǎn)品更安全、更可靠,并讓客戶也能放心使用我們的工具”。
參考資料:
《Why AI sometimes gets it wrong — and big strides to address it》
本文鏈接:http://www.www897cc.com/showinfo-45-4746-0.html微軟正努力治療 AI 幻覺,以技術(shù)手段實時屏蔽和重寫毫無根據(jù)的信息
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: OpenAI 首席技術(shù)官:GPT-5 將在一年半后發(fā)布,部分領(lǐng)域智能達到“博士”級別