當前位置：首頁 > 科技 > 資訊

AI“模型崩潰”風險需警惕

來源：責編：時間：2024-09-25 09:46:59 112觀看

導讀　　從客戶服務到內容創作，人工智能（AI）影響了眾多領域的進展。但是，一個日益嚴重的被稱為“模型崩潰”的問題，可能會使AI的所有成就功虧一簣?！　　澳Ｐ捅罎ⅰ笔墙衲?月發表在英國《自然》雜志上的一篇研究論文指出的問

　　從客戶服務到內容創作，人工智能（AI）影響了眾多領域的進展。但是，一個日益嚴重的被稱為“模型崩潰”的問題，可能會使AI的所有成就功虧一簣。

　　“模型崩潰”是今年7月發表在英國《自然》雜志上的一篇研究論文指出的問題。它是指用AI生成的數據集訓練未來幾代機器學習模型，可能會嚴重“污染”它們的輸出。

　　多家外媒報道稱，這不僅是數據科學家需要擔心的技術問題，如果不加控制，“模型崩潰”可能會對企業、技術和整個數字生態系統產生深遠影響。天津大學自然語言處理實驗室負責人熊德意教授在接受記者采訪時，從專業角度對“模型崩潰”進行了解讀。

圖片來源：美國《The Week》

　　“模型崩潰”是怎么回事

　　大多數AI模型，比如GPT-4，都是通過大量數據進行訓練的，其中大部分數據來自互聯網。最初，這些數據是由人類生成的，反映了人類語言、行為和文化的多樣性和復雜性。AI從這些數據中學習，并用它來生成新內容。

　　然而，當AI在網絡上搜索新數據來訓練下一代模型時，AI很可能會吸收一些自己生成的內容，從而形成反饋循環，其中一個AI的輸出成為另一個AI的輸入。當生成式AI用自己的內容進行訓練時，其輸出也會偏離現實。這就像多次復制一份文件，每個版本都會丟失一些原始細節，最終得到的是一個模糊的、不那么準確的結果。

　　美國《紐約時報》報道稱，當AI脫離人類輸入內容時，其輸出的質量和多樣性會下降。

　　熊德意解讀稱：“真實的人類語言數據，其分布通常符合齊普夫定律，即詞頻與詞的排序成反比關系。齊普夫定律揭示了人類語言數據存在長尾現象，即存在大量的低頻且多樣化的內容?！?span style="display:none">3PH28資訊網——每日最新資訊28at.com

　　熊德意進一步解釋道，由于存在近似采樣等錯誤，在模型生成的數據中，真實分布的長尾現象逐漸消失，模型生成數據的分布逐漸收斂至與真實分布不一致的分布，多樣性降低，導致“模型崩潰”。

　　AI自我“蠶食”是壞事嗎

　　對于“模型崩潰”，美國《The Week》雜志近日刊文評論稱，這意味著AI正在自我“蠶食”。

　　熊德意認為，伴隨著這一現象的出現，模型生成數據在后續模型迭代訓練中占比越高，后續模型丟失真實數據的信息就會越多，模型訓練就更加困難。

　　乍一看，“模型崩潰”在當前似乎還是一個僅需要AI研究人員在實驗室中擔心的小眾問題，但其影響將是深遠而長久的。

　　美國《大西洋月刊》刊文指出，為了開發更先進的AI產品，科技巨頭可能不得不向程序提供合成數據，即AI系統生成的模擬數據。然而，由于一些生成式AI的輸出充斥著偏見、虛假信息和荒謬內容，這些會傳遞到AI模型的下一版本中。

　　美國《福布斯》雜志報道稱，“模型崩潰”還可能會加劇AI中的偏見和不平等問題。

　　不過，這并不意味著所有合成數據都是不好的?！都~約時報》表示，在某些情況下，合成數據可以幫助AI學習。例如，當使用大型AI模型的輸出訓練較小的模型時，或者當可以驗證正確答案時，比如數學問題的解決方案或國際象棋、圍棋等游戲的最佳策略。

　　AI正在占領互聯網嗎

　　訓練新AI模型的問題可能凸顯出一個更大的挑戰?！犊茖W美國人》雜志表示，AI內容正在占領互聯網，大型語言模型生成的文本正充斥著數百個網站。與人工創作的內容相比，AI內容的創作速度更快，數量也更大。

　　OpenAI首席執行官薩姆·奧特曼今年2月曾表示，該公司每天生成約1000億個單詞，相當于100萬本小說的文本，其中有一大部分會流入互聯網。

　　互聯網上大量的AI內容，包括機器人發布的推文、荒謬的圖片和虛假評論，引發了一種更為消極的觀念。《福布斯》雜志稱，“死亡互聯網理論”認為，互聯網上的大部分流量、帖子和用戶都已被機器人和AI生成的內容所取代，人類不再能決定互聯網的方向。這一觀念最初只在網絡論壇上流傳，但最近卻獲得了更多關注。

　　幸運的是，專家們表示，“死亡互聯網理論”尚未成為現實?！陡２妓埂冯s志指出，絕大多數廣為流傳的帖子，包括一些深刻的觀點、犀利的語言、敏銳的觀察，以及在新背景下對新生事物的定義等內容，都不是AI生成的。

　　不過，熊德意仍強調：“隨著大模型的廣泛應用，AI合成數據在互聯網數據中的占比可能會越來越高，大量低質量的AI合成數據，不僅會使后續采用互聯網數據訓練的模型出現一定程度的‘模型崩潰’，而且也會對社會形成負面影響，比如生成的錯誤信息對部分人群形成誤導等。因此，AI生成內容不僅是一個技術問題，同時也是社會問題，需要從安全治理與AI技術雙重角度進行有效應對。”（記者張佳欣）

本文鏈接：http://www.www897cc.com/showinfo-16-115986-0.htmlAI“模型崩潰”風險需警惕

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：華為WATCH GT 5系列：新典范來襲，旗艦穿戴再攀高峰？

下一篇：力箭一號遙四發射成功，一箭五星如何實現商業航天新突破？

標簽：

熱門焦點

小米官宣：2023年上半年出貨量中國第一！

今日早間，小米電視官方微博帶來消息，稱2023年小米電視上半年出貨量達到了中國第一，同時還表示小米電視的巨屏風暴即將開始。“公布一個好消息2023年#小米電視上半年出貨量中國
Redmi Pad評測：紅米充滿野心的一次嘗試

從Note系列到K系列，從藍牙耳機到筆記本電腦，紅米不知不覺之間也已經形成了自己頗有競爭力的產品體系，在中端和次旗艦市場上甚至要比小米新機的表現來得更好，正所謂“大丈夫生居
小米降噪藍牙耳機Necklace分享：聽一首歌讀懂一個故事

在今天下午的小米Civi 2新品發布會上，小米還帶來了一款新的降噪藍牙耳機Necklace，我們也在發布結束的第一時間給大家帶來這款耳機的簡單分享?，F在大家能見到最多的藍牙耳機
5月iOS設備好評榜：iPhone 14僅排第43？

來到新的一月，安兔兔的各個榜單又重新匯總了數據，像安卓陣營的榜單都有著比較大的變動，不過iOS由于設備的更新換代并沒有那么快，所以相對來說變化并不大，特別是iOS好評榜，老款設
消息稱迪士尼要拍真人版《魔發奇緣》：女主可能也找黑人演員

8月5日消息，迪士尼確實有點忙，忙著將不少動畫改成真人版，繼《美人魚》后，真人版《白雪公主》、《魔發奇緣》也在路上了。據外媒消息稱，迪士尼將打造真人版
一篇聊聊Go錯誤封裝機制

%w 是用于錯誤包裝（Error Wrapping）的格式化動詞。它是用于 fmt.Errorf 和 fmt.Sprintf 函數中的一個特殊格式化動詞，用于將一個錯誤（或其他可打印的值）包裝在一個新的錯誤中。使
一篇文章帶你了解 CSS 屬性選擇器

屬性選擇器對帶有指定屬性的 HTML 元素設置樣式?？梢詾閾碛兄付▽傩缘?HTML 元素設置樣式，而不僅限于 class 和 id 屬性。一、了解屬性選擇器CSS屬性選擇器提供了一種簡單而
OPPO K11搭載長壽版100W超級閃充：26分鐘充滿100%

據此前官方宣布，OPPO將于7月25日也就是今天下午14:30舉辦新品發布會，屆時全新的OPPO K11將正式與大家見面，將主打旗艦影像，和同檔位競品相比，其最大的賣
電博會上海爾智家模擬500平大平層，還原生活空間沉浸式體驗

電博會為了更好地讓參展觀眾真正感受到智能家居的絕妙之處，海爾智家的程傳嶺先生同樣介紹了展會上海爾智家的模擬500平大平層，還原生活空間沉浸式體驗。程傳

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

AI“模型崩潰”風險需警惕

小米官宣：2023年上半年出貨量中國第一！

Redmi Pad評測：紅米充滿野心的一次嘗試

小米降噪藍牙耳機Necklace分享：聽一首歌讀懂一個故事

5月iOS設備好評榜：iPhone 14僅排第43？

消息稱迪士尼要拍真人版《魔發奇緣》：女主可能也找黑人演員

一篇聊聊Go錯誤封裝機制

一篇文章帶你了解 CSS 屬性選擇器

OPPO K11搭載長壽版100W超級閃充：26分鐘充滿100%

電博會上海爾智家模擬500平大平層，還原生活空間沉浸式體驗

最新推薦

猜你喜歡

熱門推薦

相關資訊