當(dāng)前位置：首頁 > 元宇宙 > AI

BBC 研究：AI 聊天機(jī)器人總結(jié)新聞錯誤百出，分不清事實和觀點

來源：責(zé)編：時間：2025-02-13 10:47:27 68觀看

導(dǎo)讀 2 月 12 日消息，英國廣播公司（BBC）近期開展了一項大規(guī)模研究，旨在評估人工智能（AI）聊天機(jī)器人在新聞總結(jié)方面的表現(xiàn)。研究涉及了微軟的 Copilot、OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Perplexity 等多款知名 AI

2 月 12 日消息，英國廣播公司（BBC）近期開展了一項大規(guī)模研究，旨在評估人工智能（AI）聊天機(jī)器人在新聞總結(jié)方面的表現(xiàn)。研究涉及了微軟的 Copilot、OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Perplexity 等多款知名 AI 工具。然而，研究結(jié)果顯示，這些工具在生成新聞總結(jié)時存在大量準(zhǔn)確性問題。

研究中，BBC 讓這些 AI 工具對 100 篇新聞報道進(jìn)行總結(jié)，并基于總結(jié)提出內(nèi)容相關(guān)問題。結(jié)果顯示，AI 生成的答案中有超過一半存在“顯著問題”，其中約五分之一的答案引入了明顯的事實錯誤，這些錯誤包括數(shù)據(jù)、陳述和日期等關(guān)鍵信息。BBC 新聞與時事首席執(zhí)行官德博拉?特內(nèi)斯（Deborah Turness）指出：“AI 助手在引用 BBC 文章內(nèi)容時，超過十分之一的‘引文’被篡改或根本不存在于原文中。”

此外，研究還發(fā)現(xiàn)，AI 助手在新聞總結(jié)時無法區(qū)分事實與觀點，也無法辨別新聞報道中當(dāng)下的信息和歷史存檔的信息，在給出答案的時候還容易摻入主觀的觀點。特內(nèi)斯表示：“這些 AI 工具所生成的結(jié)果往往是各種問題的混合體，與消費者所期望的經(jīng)過驗證的事實和清晰性相去甚遠(yuǎn)?！?span style="display:none">vVX28資訊網(wǎng)——每日最新資訊28at.com

值得注意的是，BBC 的研究還發(fā)現(xiàn)，微軟的 Copilot 和谷歌的 Gemini 在處理新聞總結(jié)時出現(xiàn)了更復(fù)雜的問題，相較于 ChatGPT 和 Perplexity，它們在區(qū)分觀點與事實、編輯化處理以及遺漏關(guān)鍵背景信息方面表現(xiàn)不佳。

注意到，AI 工具的準(zhǔn)確性問題并非僅限于這些聊天機(jī)器人。蘋果公司近期也因旗下 Apple Intelligence 通知工具分享錯誤標(biāo)題而引發(fā)爭議，導(dǎo)致其暫時停用該功能，并遭到新聞機(jī)構(gòu)和自由團(tuán)體的批評。

BBC 呼吁，在與 AI 服務(wù)提供商進(jìn)行深入對話并找到解決方案之前，應(yīng)暫停使用 AI 生成的新聞總結(jié)。特內(nèi)斯表示：“我們希望通過合作，共同尋找解決辦法?！?span style="display:none">vVX28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接：http://www.www897cc.com/showinfo-45-10685-0.htmlBBC 研究：AI 聊天機(jī)器人總結(jié)新聞錯誤百出，分不清事實和觀點

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： Perplexity 推出新版 Sonar 搜索模型：1200 Token s 疾速，比肩前沿模型

下一篇：歐盟將豪擲 2000 億歐元用于 AI 研發(fā)

標(biāo)簽：

熱門焦點

花房集團(tuán)上市，走向元宇宙新征程

文 | 港股研究社作者 | 熊生12月12日，花房集團(tuán)在港交所成功上市，首日便受到追捧，當(dāng)日最高漲幅達(dá)28.75%。繼360、360數(shù)科、魯大師后，這是“紅衣教主”周
挖來Meta AR高管，難道蘋果也要進(jìn)軍元宇宙？

“被曝光”的才是最吸引人的產(chǎn)品，相信有關(guān)注過蘋果硬件消息的朋友們都明白這樣的道理。往近了說有蘋果“即將發(fā)布”的iPhone SE 3和M2芯片，往遠(yuǎn)了說有“折疊屏iP
2022年6款最佳的NFT稀有度查詢工具

NFT正在風(fēng)靡全球，但擁有一個你自認(rèn)為看起來很酷的 NFT 是不夠的，因為它還應(yīng)該是稀有的，稀有度會影響每個 NFT 的價值。因此，如果您打算投資 NFT，則需要使用 NFT 稀
Web3 去中心化身份管理系統(tǒng)的歷史、現(xiàn)狀與展望

身份、數(shù)字資產(chǎn)和在線資料的映射最近在區(qū)塊鏈行業(yè)獲得了極大的關(guān)注。新技術(shù)正在形成架構(gòu)，這將進(jìn)一步為去中心化和以用戶為中心的機(jī)制鋪平道路。本文將討論以下
索尼公布PSVR 2頭顯渲染圖；社區(qū)開發(fā)者發(fā)布Quest版《我的世界》

近日熱點：索尼正式公布PSVR 2頭顯及控制器官方渲染圖；入局元宇宙，鴻?？萍寂cXRSPACE簽訂合作備忘錄；研究人員表示面部追蹤可增強(qiáng)VR操控體驗；社區(qū)開發(fā)者QuestCraft發(fā)
NFT自動售貨機(jī)來啦！

“紐約市有一臺售賣 Solana NFT 的自動售貨機(jī)，用信用卡就能買”Solana NFT 市場 Neon 可讓您使用信用卡親自購買 NFT，無需使用加密貨幣。由于基于 Solana 鏈的 N
解決NFT流動性問題：一文了解Floor DAO

流動性是證券市場上的一個術(shù)語，流動性是指資產(chǎn)在不影響其市場價格的情況下可以轉(zhuǎn)換為現(xiàn)成現(xiàn)金的效率，流動性最強(qiáng)的資產(chǎn)是現(xiàn)金本身?，F(xiàn)在讓我們試著從流動性的角
元宇宙平臺會是上世紀(jì)末的互聯(lián)網(wǎng)嗎？

“元宇宙”火了好幾個月，互聯(lián)網(wǎng)大廠忙于布局，資本市場熱烈追捧。然而很多人還是看不明白，更多的人覺得這是一場泡沫，一場騙局。一開始接觸這個怪里怪氣的名詞，感覺
頂級NFT收藏家Gary Vaynerchuk 與百威推出NFT

特別聲明，我們的文章不作為投資建議，請各位讀者獨立思考，還是那句話：投資要慎之又慎，誰也不要相信。Gary Verneychuk 和百威 NFT 之一。由 VeynerNFT 提供百威推出

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

BBC 研究：AI 聊天機(jī)器人總結(jié)新聞錯誤百出，分不清事實和觀點

花房集團(tuán)上市，走向元宇宙新征程

挖來Meta AR高管，難道蘋果也要進(jìn)軍元宇宙？

2022年6款最佳的NFT稀有度查詢工具

Web3 去中心化身份管理系統(tǒng)的歷史、現(xiàn)狀與展望

索尼公布PSVR 2頭顯渲染圖；社區(qū)開發(fā)者發(fā)布Quest版《我的世界》

NFT自動售貨機(jī)來啦！

解決NFT流動性問題：一文了解Floor DAO

元宇宙平臺會是上世紀(jì)末的互聯(lián)網(wǎng)嗎？

頂級NFT收藏家Gary Vaynerchuk 與百威推出NFT

最新推薦

雷克薩斯高管，“受賄”5000萬？

FMIFAwards獎項即將揭曉！

元宇宙里掀起回憶殺？這波虛擬懷舊營銷主打一個極限反差

“虛擬人”角斗場，基于“硬實力”下的人性平衡法則？

扎克伯格演示了一種“造物主”式的元宇宙語音機(jī)器人工具

又一家數(shù)字營銷公司入局元宇宙，國內(nèi)首個藝術(shù)元宇宙社區(qū)“Meta彼岸”上線

猜你喜歡

熱門推薦

相關(guān)資訊