日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

研究發現:AI 越聰明就越有可能“胡編亂造”

來源: 責編: 時間:2024-10-01 17:06:44 71觀看
導讀 9 月 29 日消息,一項新研究發現,隨著大型語言模型(LLM)變得越來越強大,它們似乎也越來越容易編造事實,而不是避免或拒絕回答它們無法回答的問題。這表明,這些更聰明的 AI 聊天機器人實際上變得不太可靠。圖源 Pexels

9 月 29 日消息,一項新研究發現,隨著大型語言模型(LLM)變得越來越強大,它們似乎也越來越容易編造事實,而不是避免或拒絕回答它們無法回答的問題。這表明,這些更聰明的 AI 聊天機器人實際上變得不太可靠。BQP28資訊網——每日最新資訊28at.com

BQP28資訊網——每日最新資訊28at.com

圖源 Pexels

注意到,該研究發表在《自然》雜志上,研究人員研究了一些業界領先的商業 LLM:OpenAI 的 GPT 和 Meta 的 LLaMA,以及由研究小組 BigScience 創建的開源模型 BLOOM。BQP28資訊網——每日最新資訊28at.com

研究發現,雖然這些 LLM 的回答在許多情況下變得更加準確,但總體上可靠性更差,給出錯誤答案的比例比舊模型更高。BQP28資訊網——每日最新資訊28at.com

瓦倫西亞人工智能研究所在西班牙的研究員 José Hernández-Orallo 對《自然》雜志表示:“如今,它們幾乎可以回答一切。這意味著更多正確的答案,但也意味著更多錯誤的答案。”BQP28資訊網——每日最新資訊28at.com

格拉斯哥大學的科學和技術哲學家 Mike Hicks 對此進行了更嚴厲的評價,Hicks(未參與該研究)告訴《自然》雜志:“在我看來,這就像我們所說的胡說八道,它越來越擅長假裝知識淵博。”BQP28資訊網——每日最新資訊28at.com

測試中,這些模型被問及了從數學到地理等各種主題,并被要求執行諸如按指定順序列出信息等任務。總體而言,更大、更強大的模型給出了最準確的答案,但在更難的問題上表現不佳,其準確率較低。BQP28資訊網——每日最新資訊28at.com

研究人員稱,一些最大的“撒謊者”是 OpenAI 的 GPT-4 和 o1,但所有被研究的 LLM 似乎都呈這種趨勢,對于 LLaMA 系列模型,沒有一個能夠達到 60% 的準確率,即使是最簡單的問題。BQP28資訊網——每日最新資訊28at.com

而當被要求判斷聊天機器人的回答是準確還是不準確時,一小部分參與者有 10% 到 40% 的概率判斷錯誤。BQP28資訊網——每日最新資訊28at.com

總之研究表明,AI 模型越大(就參數、訓練數據和其他因素而言),它們給出錯誤答案的比例就越高。BQP28資訊網——每日最新資訊28at.com

研究人員稱,解決這些問題最簡單的方法是讓 LLM 不那么急于回答一切。Hernández-Orallo 稱:“可以設置一個閾值,當問題具有挑戰性時,讓聊天機器人說‘不,我不知道’。”但如果聊天機器人被限制為只回答它們知道的東西,可能會暴露技術的局限性。BQP28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-8015-0.html研究發現:AI 越聰明就越有可能“胡編亂造”

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 字節跳動發布豆包視頻生成模型,這效果讓我分不清 AI 與現實

下一篇: 國際機器人聯合會:2023 年我國新安裝工業機器人 27.63 萬臺,超全球半數

標簽:
  • 熱門焦點
  • 元宇宙的文旅賽道,還能如何發力?

    來源:X增強現實蘋果推出Vision Pro,為XR行業注入一劑強心針。而在蘋果開發者大會上迪士尼CEO鮑勃·艾格在宣布迪士尼與蘋果達成合作,其Disney+流媒體服務將于Vision Pro
  • 雷克薩斯高管,“受賄”5000萬?

    來源:毒舌科技作者:潘磊雷克薩斯的高管,好像出事了。五六家日本小媒體,突然曝出了一個與中國市場有關的大新聞——雷克薩斯中國區一個高管受賄10億日元(約合人民幣5000
  • 元媧2.7上線:虛擬人視頻制作速度瘋狂翻倍!

    來源:清元宇宙 炎炎夏日努力工作的Q仔的電腦都冒煙兒啦~今天要給大家介紹兩個新小伙伴——小元和小媧,他們將給大家解讀元媧2.7版本重磅更新內容~大家掌聲歡迎~~~本次更
  • 萬字專訪Vitalik Buterin:以太坊將成為主流和最安全的基礎層

    Vitalik Buterin 在 19 歲時撰寫了以太坊白皮書。他的目標簡單而全面,即創建一個“世界計算機”,旨在成為所有在線應用程序的靈活基礎層,無需任何第三方。自 2015
  • 江西將探索成立元宇宙聯盟,韓國將加強對NFT和元宇宙的監管

    《元宇宙新鮮事》有:江西將探索成立元宇宙聯盟,支持南昌規劃建設元宇宙試驗區;韓國金融監督局將加強對NFT和元宇宙的監管;任天堂社長表示暫時不打算加入元宇宙。【
  • 智能人機交互技術的春晚大考

    1月初的一個早晨,京東智能客戶服務產品部緊急開會,進行關于尚未對外公布的“X項目”的初討論。1月5日,這個神秘的X項目對外公布,京東成為央視2022年春晚獨家互動合
  • 影響元宇宙土地價格的五個因素

    參考來源 | cryptonews編譯 | Ciel@iNFTnews.com元宇宙中的房地產價格主要取決于使用它的人數,以及為所有者創造收益的能力。專注于數字資產的投資公司LedgerPr
  • 如何在元宇宙中建立品牌忠誠度

    Snoop Dogg、耐克、蘇富比和普華永道都有什么共同點?他們都投資于元宇宙的房地產。除了我們在屏幕上看到的二維世界--手機、筆記本電腦、臺式機或iPad--他們決
  • 虛擬人行業研究報告

    最早的虛擬人出現于 20 世紀 80 年代,受限于技術,當時的虛擬人制作以手繪為主。21 世紀初,隨著動捕、渲染等技術的逐步發展,虛擬人相關技術開始在影視領域逐漸普及
Top 主站蜘蛛池模板: 勐海县| 马公市| 红河县| 那曲县| 万载县| 新绛县| 武乡县| 南召县| 锦州市| 来宾市| 宝山区| 阳曲县| 新化县| 永和县| 隆安县| 石家庄市| 明溪县| 桂林市| 台前县| 巴南区| 冀州市| 鹤岗市| 武强县| 余庆县| 德昌县| 双流县| 平邑县| 永州市| 铜陵市| 正蓝旗| 金阳县| 安阳市| 庆元县| 芒康县| 沂南县| 施秉县| 鸡泽县| 张家界市| 徐汇区| 泸溪县| 彭州市|