日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

哥倫比亞大學研究:AI 搜索工具平均準確率僅六成,且自信滿滿“不認錯”

來源: 責編: 時間:2025-03-15 14:50:04 64觀看
導讀 3 月 13 日消息,據外媒 Techspot 周二報道,哥倫比亞大學數字新聞研究中心(Tow Center for Digital Journalism)近期對八款 AI 搜索引擎展開研究,包括 ChatGPT Search、Perplexity、Perplexity Pro、Gemini、DeepSe

3 月 13 日消息,據外媒 Techspot 周二報道,哥倫比亞大學數字新聞研究中心(Tow Center for Digital Journalism)近期對八款 AI 搜索引擎展開研究,包括 ChatGPT Search、Perplexity、Perplexity Pro、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search 和 Copilot。研究人員測試了每款引擎的準確性,并記錄了它們拒絕回答問題的頻率。cqa28資訊網——每日最新資訊28at.com

cqa28資訊網——每日最新資訊28at.com

研究人員從 20 家新聞機構中隨機挑選了 200 篇報道(每家 10 篇),確保它們在谷歌搜索時能排在前三位,然后用相同的查詢方式測試各 AI 搜索工具,并評估它們是否正確引用了文章內容、新聞機構名稱和原始鏈接。cqa28資訊網——每日最新資訊28at.com

測試結果顯示,除 Perplexity 及其付費版外,其余 AI 搜索引擎的表現都不盡如人意。整體來看,AI 搜索引擎提供的答案有 60% 是不準確的,而且 AI 對錯誤答案的“自信”反而加劇了問題。cqa28資訊網——每日最新資訊28at.com

這項研究的重要性在于,它用數據印證了外界多年來的擔憂 —— 大語言模型僅會出錯,還擅長一本正經地胡說八道。它們往往以絕對肯定的語氣陳述錯誤信息,甚至在被質疑時仍然試圖自圓其說。cqa28資訊網——每日最新資訊28at.com

即使承認了錯誤,ChatGPT 仍可能在后續回答中繼續編造內容。在大語言模型的設定中,幾乎是“無論如何都要給出答案”。研究數據支持了這一觀點:ChatGPT Search 是唯一回答了所有 200 個新聞查詢的 AI 工具,但其“完全正確”率僅 28%,而“完全錯誤”率高達 57%。cqa28資訊網——每日最新資訊28at.com

ChatGPT 并非表現最糟的。X 旗下的 Grok AI 表現尤為不堪,其中 Grok-3 Search 的錯誤率高達 94%。微軟 Copilot 也問題重重 —— 在 200 次查詢中,有 104 次拒絕作答,剩下的 96 次中,僅 16 次“完全正確”,14 次“部分正確”,66 次“完全錯誤”,總體錯誤率接近 70%。cqa28資訊網——每日最新資訊28at.com

這些 AI 工具的開發公司并未公開承認這些問題,卻仍向用戶收取每月 20 至 200 美元(備注:當前約 145 至 1449 元人民幣)的訂閱費。此外,付費版 Perplexity Pro(20 美元 / 月)和 Grok-3 Search(40 美元 / 月)比免費版回答得更多,但錯誤率也更高。cqa28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-11482-0.html哥倫比亞大學研究:AI 搜索工具平均準確率僅六成,且自信滿滿“不認錯”

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 中關村科金引領垂類大模型時代,得助平臺與智能客服全新升級亮相

下一篇: 北京市中小學將打造首批 11 個 AI 應用場景

標簽:
  • 熱門焦點
  • 元宇宙終究沒火過兩年

    來源:傳播體操在ChatGPT快速破圈的同時,元宇宙的熱度卻一瀉千里。雖然互聯網大廠們都沒有否認元宇宙的長期想象力,但在行動上卻都紛紛表示了對元宇宙短期前景的悲觀。號稱改變
  • B端難做:留給魔琺科技的時間不多了

    來源:零態LT元宇宙泡沫正在碎裂,進入2023年后這一賽道熱度一直在遞減。今年2月,微軟解散了成立僅四個月的工業元宇宙部門;今年3月,該公司2017年收購的虛擬現實社交平臺AltspaceVR
  • 2022年最具關注的9個頭像NFT項目

    什么是 PFP NFT 項目?PFP NFT (個人資料圖片NFT)是一組獨特的數字收藏品,人們用來在互聯網平臺上代表自己。這些數字藝術作品通常是一系列可作為頭像的角色,在 Twit
  • 新款英特爾芯片將使NFT鑄造變得更加方便

    科技巨頭和微處理器制造商英特爾(Intel)正在發布一款適用于 NFT 鑄造和挖礦的新芯片。新產品專注于效率、易操作性和可持續性,該公司的戰略是從加密興起與 NFT爆
  • 吸金31億美元,誰在催火2021年的鏈游?

    2021年究竟發生了什么,才使得鏈游領域在這年一飛沖天?作者:廖羽2022年2月16日,Invest Game發布《2021年全球游戲投資報告》,報告顯示,游戲行業的投資重點正在向區塊
  • 全面擁抱“虛擬世界”,摩登天空要打造“音樂元宇宙”

    作者:袁佳琦沈黎暉不怎么打游戲,但許多事兒在他眼里都“有意思”。好玩,有意思,是他的口頭禪,在接受娛樂獨角獸的采訪過程中,他多次提到,做虛擬音樂人,“是件挺好玩的
  • NFT 技術將傳世之作帶入博物館

    意大利四大博物館已與一個項目合作,該項目將展示和銷售達芬奇、卡拉瓦喬、拉斐爾和莫迪利亞尼等人的杰作的 NFT復制品。該計劃采用了 科技公司Cincello的國際專
  • 技術賦能,國內首家寵物元宇宙平臺“Pet Meta”開啟虛擬養寵新方式

    作者:易明未來,Pet Meta數字寵物藏品將是鏈接全球數億愛寵人群與元宇宙世界獨一無二的身份象征。首家面向國內的寵物元宇宙平臺Pet Meta生長于“寵物經濟”快速
  • 虛擬偶像行業的商用價值逐漸凸顯,IP生態圈也逐漸成型

    六月的第一個周六,一場虛擬偶像七海Nana7mi的個人3D演唱會在萬代南夢宮上海文化中心舉行,相較于洛天依、百大UP主泠鳶yousa等,這位虛擬Up主在B站上的粉絲數43.6萬
Top 主站蜘蛛池模板: 景东| 慈利县| 财经| 松桃| 台山市| 郁南县| 岳阳县| 白水县| 汉寿县| 迁西县| 波密县| 罗山县| 五寨县| 大石桥市| 玛纳斯县| 三亚市| 垣曲县| 普格县| 安平县| 张家界市| 漾濞| 博乐市| 磐石市| 台中县| 宁安市| 临清市| 宁远县| 丹江口市| 措美县| 紫阳县| 乡城县| 南昌市| 山东省| 灌云县| 同江市| 大渡口区| 荥阳市| 岳普湖县| 兴宁市| 响水县| 安化县|