日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 資訊

AI“模型崩潰”風險需警惕

來源: 責編: 時間:2024-09-25 09:46:59 92觀看
導讀  從客戶服務到內容創作,人工智能(AI)影響了眾多領域的進展。但是,一個日益嚴重的被稱為“模型崩潰”的問題,可能會使AI的所有成就功虧一簣。  “模型崩潰”是今年7月發表在英國《自然》雜志上的一篇研究論文指出的問

  從客戶服務到內容創作,人工智能(AI)影響了眾多領域的進展。但是,一個日益嚴重的被稱為“模型崩潰”的問題,可能會使AI的所有成就功虧一簣。1ik28資訊網——每日最新資訊28at.com

  “模型崩潰”是今年7月發表在英國《自然》雜志上的一篇研究論文指出的問題。它是指用AI生成的數據集訓練未來幾代機器學習模型,可能會嚴重“污染”它們的輸出。1ik28資訊網——每日最新資訊28at.com

  多家外媒報道稱,這不僅是數據科學家需要擔心的技術問題,如果不加控制,“模型崩潰”可能會對企業、技術和整個數字生態系統產生深遠影響。天津大學自然語言處理實驗室負責人熊德意教授在接受記者采訪時,從專業角度對“模型崩潰”進行了解讀。1ik28資訊網——每日最新資訊28at.com

1ik28資訊網——每日最新資訊28at.com

圖片來源:美國《The Week》1ik28資訊網——每日最新資訊28at.com

  “模型崩潰”是怎么回事1ik28資訊網——每日最新資訊28at.com

  大多數AI模型,比如GPT-4,都是通過大量數據進行訓練的,其中大部分數據來自互聯網。最初,這些數據是由人類生成的,反映了人類語言、行為和文化的多樣性和復雜性。AI從這些數據中學習,并用它來生成新內容。1ik28資訊網——每日最新資訊28at.com

  然而,當AI在網絡上搜索新數據來訓練下一代模型時,AI很可能會吸收一些自己生成的內容,從而形成反饋循環,其中一個AI的輸出成為另一個AI的輸入。當生成式AI用自己的內容進行訓練時,其輸出也會偏離現實。這就像多次復制一份文件,每個版本都會丟失一些原始細節,最終得到的是一個模糊的、不那么準確的結果。1ik28資訊網——每日最新資訊28at.com

  美國《紐約時報》報道稱,當AI脫離人類輸入內容時,其輸出的質量和多樣性會下降。1ik28資訊網——每日最新資訊28at.com

  熊德意解讀稱:“真實的人類語言數據,其分布通常符合齊普夫定律,即詞頻與詞的排序成反比關系。齊普夫定律揭示了人類語言數據存在長尾現象,即存在大量的低頻且多樣化的內容。”1ik28資訊網——每日最新資訊28at.com

  熊德意進一步解釋道,由于存在近似采樣等錯誤,在模型生成的數據中,真實分布的長尾現象逐漸消失,模型生成數據的分布逐漸收斂至與真實分布不一致的分布,多樣性降低,導致“模型崩潰”。1ik28資訊網——每日最新資訊28at.com

  AI自我“蠶食”是壞事嗎1ik28資訊網——每日最新資訊28at.com

  對于“模型崩潰”,美國《The Week》雜志近日刊文評論稱,這意味著AI正在自我“蠶食”。1ik28資訊網——每日最新資訊28at.com

  熊德意認為,伴隨著這一現象的出現,模型生成數據在后續模型迭代訓練中占比越高,后續模型丟失真實數據的信息就會越多,模型訓練就更加困難。1ik28資訊網——每日最新資訊28at.com

  乍一看,“模型崩潰”在當前似乎還是一個僅需要AI研究人員在實驗室中擔心的小眾問題,但其影響將是深遠而長久的。1ik28資訊網——每日最新資訊28at.com

  美國《大西洋月刊》刊文指出,為了開發更先進的AI產品,科技巨頭可能不得不向程序提供合成數據,即AI系統生成的模擬數據。然而,由于一些生成式AI的輸出充斥著偏見、虛假信息和荒謬內容,這些會傳遞到AI模型的下一版本中。1ik28資訊網——每日最新資訊28at.com

  美國《福布斯》雜志報道稱,“模型崩潰”還可能會加劇AI中的偏見和不平等問題。1ik28資訊網——每日最新資訊28at.com

  不過,這并不意味著所有合成數據都是不好的。《紐約時報》表示,在某些情況下,合成數據可以幫助AI學習。例如,當使用大型AI模型的輸出訓練較小的模型時,或者當可以驗證正確答案時,比如數學問題的解決方案或國際象棋、圍棋等游戲的最佳策略。1ik28資訊網——每日最新資訊28at.com

  AI正在占領互聯網嗎1ik28資訊網——每日最新資訊28at.com

  訓練新AI模型的問題可能凸顯出一個更大的挑戰。《科學美國人》雜志表示,AI內容正在占領互聯網,大型語言模型生成的文本正充斥著數百個網站。與人工創作的內容相比,AI內容的創作速度更快,數量也更大。1ik28資訊網——每日最新資訊28at.com

  OpenAI首席執行官薩姆·奧特曼今年2月曾表示,該公司每天生成約1000億個單詞,相當于100萬本小說的文本,其中有一大部分會流入互聯網。1ik28資訊網——每日最新資訊28at.com

  互聯網上大量的AI內容,包括機器人發布的推文、荒謬的圖片和虛假評論,引發了一種更為消極的觀念。《福布斯》雜志稱,“死亡互聯網理論”認為,互聯網上的大部分流量、帖子和用戶都已被機器人和AI生成的內容所取代,人類不再能決定互聯網的方向。這一觀念最初只在網絡論壇上流傳,但最近卻獲得了更多關注。1ik28資訊網——每日最新資訊28at.com

  幸運的是,專家們表示,“死亡互聯網理論”尚未成為現實。《福布斯》雜志指出,絕大多數廣為流傳的帖子,包括一些深刻的觀點、犀利的語言、敏銳的觀察,以及在新背景下對新生事物的定義等內容,都不是AI生成的。1ik28資訊網——每日最新資訊28at.com

  不過,熊德意仍強調:“隨著大模型的廣泛應用,AI合成數據在互聯網數據中的占比可能會越來越高,大量低質量的AI合成數據,不僅會使后續采用互聯網數據訓練的模型出現一定程度的‘模型崩潰’,而且也會對社會形成負面影響,比如生成的錯誤信息對部分人群形成誤導等。因此,AI生成內容不僅是一個技術問題,同時也是社會問題,需要從安全治理與AI技術雙重角度進行有效應對。”(記者 張佳欣)1ik28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-16-115986-0.htmlAI“模型崩潰”風險需警惕

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 華為WATCH GT 5系列:新典范來襲,旗艦穿戴再攀高峰?

下一篇: 力箭一號遙四發射成功,一箭五星如何實現商業航天新突破?

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 建昌县| 达日县| 朝阳区| 阿城市| 城口县| 吉木萨尔县| 资源县| 清远市| 高淳县| 屏边| 永和县| 陇西县| 绵阳市| 十堰市| 厦门市| 德江县| 闽侯县| 安国市| 左贡县| 邹平县| 和龙市| 大方县| 揭东县| 巴彦淖尔市| 潞西市| 奈曼旗| 秦皇岛市| 旬阳县| 搜索| 潼南县| 韶关市| 遵化市| 凤山县| 延长县| 乌兰浩特市| 饶平县| 通山县| 光泽县| 黄平县| 日喀则市| 林口县|