當(dāng)前位置：首頁 > 元宇宙 > AI

防止聊天機(jī)器人“造謠”，谷歌 Deepmind、斯坦福大學(xué)研究人員推出 AI 事實(shí)核查工具

來源：責(zé)編：時(shí)間：2024-04-02 17:06:18 186觀看

導(dǎo)讀 3 月 31 日消息，無論當(dāng)下 AI 聊天機(jī)器人有多么強(qiáng)大，都會(huì)或多或少存在一大飽受詬病的行為 —— 以看上去令人信服的方式，向用戶提供與事實(shí)不符的回答。簡單來說，AI 有時(shí)會(huì)在回答中“滿口跑火車”，甚至“造謠”。圖

3 月 31 日消息，無論當(dāng)下 AI 聊天機(jī)器人有多么強(qiáng)大，都會(huì)或多或少存在一大飽受詬病的行為 —— 以看上去令人信服的方式，向用戶提供與事實(shí)不符的回答。簡單來說，AI 有時(shí)會(huì)在回答中“滿口跑火車”，甚至“造謠”。

圖源 Pixabay

防止 AI 大模型出現(xiàn)這種行為并非易事，且是一項(xiàng)技術(shù)性的挑戰(zhàn)。不過據(jù)外媒 Marktechpost 報(bào)道，谷歌 DeepMind 和斯坦福大學(xué)似乎找到了某種變通辦法。

研究人員推出了一種基于大語言模型的工具 —— 搜索增強(qiáng)事實(shí)評估器（注：原名為 Search-Augmented Factuality Evaluator，簡稱 SAFE），可對聊天機(jī)器人生成的長回復(fù)進(jìn)行事實(shí)核查。其研究結(jié)果與實(shí)驗(yàn)代碼、數(shù)據(jù)集現(xiàn)已公布，點(diǎn)此查看

該系統(tǒng)可通過四個(gè)步驟對聊天機(jī)器人生成的回復(fù)進(jìn)行分析、處理和評估，以驗(yàn)證準(zhǔn)確性和真實(shí)性：將答案分割成單個(gè)待核查內(nèi)容、對上述內(nèi)容進(jìn)行修正、再與谷歌搜索結(jié)果進(jìn)行比較。隨后，該系統(tǒng)還會(huì)檢查各個(gè)事實(shí)與原始問題的相關(guān)性。

為評估其性能，研究人員創(chuàng)建了包含約 16000 個(gè)事實(shí)的數(shù)據(jù)集 LongFact，并在來自 Claude、Gemini、GPT、PaLM-2 的 13 個(gè)大語言模型上測試了該系統(tǒng)。結(jié)果顯示，在對 100 個(gè)有爭議的事實(shí)進(jìn)行的重點(diǎn)分析中，SAFE 的判定在進(jìn)一步審查下正確率達(dá)到 76% 。與此同時(shí)，該框架還具備經(jīng)濟(jì)性優(yōu)勢：成本比人工注釋便宜 20 多倍。

本文鏈接：http://www.www897cc.com/showinfo-45-3785-0.html防止聊天機(jī)器人“造謠”，谷歌 Deepmind、斯坦福大學(xué)研究人員推出 AI 事實(shí)核查工具

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：保時(shí)捷逐步淘汰燃油跑車，純電動(dòng)718呼之欲出

下一篇： Databricks 推出 1320 億參數(shù)大語言模型 DBRX，號稱“現(xiàn)階段最強(qiáng)開源 AI”

標(biāo)簽：

熱門焦點(diǎn)

美國一區(qū)塊鏈風(fēng)投公司宣布成立2.5億美元web3投資新基金

No.1 俄羅斯財(cái)政部長: 在俄羅斯禁止比特幣就如禁止互聯(lián)網(wǎng)一樣2月16日消息，俄羅斯財(cái)政部長安東·西盧安諾夫（Anton Siluanov）表示，在俄羅斯禁止加密貨幣就跟禁止互
8個(gè)最適合藝術(shù)家發(fā)行NFT的交易市場

近年來，加密風(fēng)靡全球。加密圈最令人興奮的方面之一是它能夠用于創(chuàng)建稱為NFT 的數(shù)字資產(chǎn)。從 CyberKitties 到 Cyber Galleries，NFT 已成為藝術(shù)家和藝術(shù)鑒賞家的
從虛擬餐廳到虛擬時(shí)裝秀，行業(yè)巨頭掀起元宇宙商標(biāo)注冊潮

自從 Facebook 更名為 Meta 后，關(guān)于元宇宙的討論愈發(fā)激烈，這一詞匯也越來越多的出現(xiàn)在我們的視野里。這是一個(gè)非常有趣的話題。伴隨著爭論，有些人認(rèn)為是馬克·扎
紐約街頭出現(xiàn)NFT自動(dòng)販賣機(jī)

一家初創(chuàng)公司宣布在紐約市開放一臺(tái)NFT自動(dòng)售貨機(jī)，允許任何人——即使是沒有加密資產(chǎn)的人也能購買NFT。該交易平臺(tái)名為Neon，上個(gè)月完成了一輪300萬美元的種子募捐
Snoop Dogg 計(jì)劃推出致力于數(shù)字媒體NFT的專業(yè)公司

雅痞哥不知道這人是誰還上新聞，問了助理，解釋，相當(dāng)于美版劉歡的地位吧。Snoop Dogg 在 NFT 領(lǐng)域已經(jīng)有一段時(shí)間了，尤其是在最近有消息稱人們在元宇宙中購買房地產(chǎn)
NFT領(lǐng)域，我們是否應(yīng)該遵守版權(quán)法

NFTs中最有爭議的因素之一是你是否真的 "擁有 "你所購買的藝術(shù)品。除此之外，圍繞著NFT行業(yè)內(nèi)的版權(quán)和知識(shí)產(chǎn)權(quán)盜竊的問題也同樣重要，因?yàn)槿藗兒苋菀渍`解這些事情
趙長鵬預(yù)測SoicalFi為今年主要驅(qū)動(dòng)力，新的機(jī)會(huì)在哪里？

作者：五火球教主前不久，趙長鵬在《財(cái)富》雜志印度版塊刊登評論。他表示：“DeFi 在 2021 年出現(xiàn)了快速創(chuàng)新，我們可能會(huì)在 2022 年看到蓬勃發(fā)展的興趣和創(chuàng)新，其中 Soc
Steam 禁止NFT和加密貨幣原因曝光

近日，Valve（V社）總裁Gabe Newell接受PC Gamer采訪時(shí)解釋了該平臺(tái)禁止NFT和加密貨幣的原因。早在2021年10月18日，PC Gamer就報(bào)道Steam推出的新規(guī)：使用區(qū)塊鏈或允許交
NFT高玩必備：NFT分析工具大盤點(diǎn)

NFT市場的火熱讓越來越多的投資者投身其中，但當(dāng)前的 NFT 生態(tài)系統(tǒng)存在幾個(gè)問題卻困擾了大多數(shù)人，如難以準(zhǔn)確評估 NFT 項(xiàng)目的資產(chǎn)價(jià)格、缺乏 NFT 市場動(dòng)態(tài)信息、

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

防止聊天機(jī)器人“造謠”，谷歌 Deepmind、斯坦福大學(xué)研究人員推出 AI 事實(shí)核查工具

美國一區(qū)塊鏈風(fēng)投公司宣布成立2.5億美元web3投資新基金

8個(gè)最適合藝術(shù)家發(fā)行NFT的交易市場

從虛擬餐廳到虛擬時(shí)裝秀，行業(yè)巨頭掀起元宇宙商標(biāo)注冊潮

紐約街頭出現(xiàn)NFT自動(dòng)販賣機(jī)

Snoop Dogg 計(jì)劃推出致力于數(shù)字媒體NFT的專業(yè)公司

NFT領(lǐng)域，我們是否應(yīng)該遵守版權(quán)法

趙長鵬預(yù)測SoicalFi為今年主要驅(qū)動(dòng)力，新的機(jī)會(huì)在哪里？

Steam 禁止NFT和加密貨幣原因曝光

NFT高玩必備：NFT分析工具大盤點(diǎn)

最新推薦

錯(cuò)過了BRC20還有eths,eth銘文協(xié)議

數(shù)字人的AB面：在元宇宙中過氣，在AIGC中重生

文心一言排名墊底，卻成為百度業(yè)績增長杠桿

頂流IP“冰墩墩”帶著中國元素NFT進(jìn)入全球視野

百度虛擬人——AI手語主播首次亮相冬奧會(huì)！

從NFT數(shù)字收藏，洞察數(shù)字音樂版權(quán)市場發(fā)展趨勢

猜你喜歡

熱門推薦

相關(guān)資訊