2 月 12 日消息,英國廣播公司(BBC)近期開展了一項大規模研究,旨在評估人工智能(AI)聊天機器人在新聞總結方面的表現。研究涉及了微軟的 Copilot、OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Perplexity 等多款知名 AI 工具。然而,研究結果顯示,這些工具在生成新聞總結時存在大量準確性問題。
研究中,BBC 讓這些 AI 工具對 100 篇新聞報道進行總結,并基于總結提出內容相關問題。結果顯示,AI 生成的答案中有超過一半存在“顯著問題”,其中約五分之一的答案引入了明顯的事實錯誤,這些錯誤包括數據、陳述和日期等關鍵信息。BBC 新聞與時事首席執行官德博拉?特內斯(Deborah Turness)指出:“AI 助手在引用 BBC 文章內容時,超過十分之一的‘引文’被篡改或根本不存在于原文中。”
此外,研究還發現,AI 助手在新聞總結時無法區分事實與觀點,也無法辨別新聞報道中當下的信息和歷史存檔的信息,在給出答案的時候還容易摻入主觀的觀點。特內斯表示:“這些 AI 工具所生成的結果往往是各種問題的混合體,與消費者所期望的經過驗證的事實和清晰性相去甚遠。”
值得注意的是,BBC 的研究還發現,微軟的 Copilot 和谷歌的 Gemini 在處理新聞總結時出現了更復雜的問題,相較于 ChatGPT 和 Perplexity,它們在區分觀點與事實、編輯化處理以及遺漏關鍵背景信息方面表現不佳。
注意到,AI 工具的準確性問題并非僅限于這些聊天機器人。蘋果公司近期也因旗下 Apple Intelligence 通知工具分享錯誤標題而引發爭議,導致其暫時停用該功能,并遭到新聞機構和自由團體的批評。
BBC 呼吁,在與 AI 服務提供商進行深入對話并找到解決方案之前,應暫停使用 AI 生成的新聞總結。特內斯表示:“我們希望通過合作,共同尋找解決辦法。”
本文鏈接:http://www.www897cc.com/showinfo-45-10685-0.htmlBBC 研究:AI 聊天機器人總結新聞錯誤百出,分不清事實和觀點
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com