當(dāng)前位置：首頁 > 科技 > 資訊

用AI訓(xùn)練AI，可能越練越“傻”

來源：責(zé)編：時間：2024-07-26 16:06:03 461觀看

導(dǎo)讀　　新華社北京7月25日電　對于人工智能（AI）大語言模型來說，通常給予的訓(xùn)練數(shù)據(jù)越多，模型就會越“聰明”。但英國《自然》雜志新發(fā)表的一項關(guān)于大模型的研究顯示，如果只用AI生成的數(shù)據(jù)來訓(xùn)練大模型，會使模型性能下降、越練

　　新華社北京7月25日電　對于人工智能（AI）大語言模型來說，通常給予的訓(xùn)練數(shù)據(jù)越多，模型就會越“聰明”。但英國《自然》雜志新發(fā)表的一項關(guān)于大模型的研究顯示，如果只用AI生成的數(shù)據(jù)來訓(xùn)練大模型，會使模型性能下降、越練越“傻”。

　　英國牛津大學(xué)、劍橋大學(xué)等機構(gòu)研究人員發(fā)現(xiàn)，如果在訓(xùn)練大模型時，只用AI生成的內(nèi)容，會導(dǎo)致大模型出現(xiàn)不可逆的缺陷，逐漸忘記真實數(shù)據(jù)的分布，這被稱為“模型崩潰”。

2024年4月23日，在德國漢諾威工博會上，參觀者與一款智能機器人進行“石頭剪子布”游戲。新華社記者任鵬飛攝

　　研究人員首先使用大語言模型創(chuàng)建類似維基百科詞條的文本，然后利用這個內(nèi)容來訓(xùn)練該模型的新版本，并反復(fù)使用前代模型生成的文本訓(xùn)練更新的版本。隨著AI生成的信息“污染”訓(xùn)練集，模型的輸出逐漸失去意義。在模型的第九次迭代中，它完成了一篇關(guān)于英國教堂塔樓的文章，其中一段文字卻在講述野兔尾巴的多種顏色。

　　研究發(fā)現(xiàn)，導(dǎo)致“模型崩潰”的重要原因是，由于模型只能從其訓(xùn)練數(shù)據(jù)中采樣，一些在第一代數(shù)據(jù)中本就低頻出現(xiàn)的詞匯，在每次迭代后出現(xiàn)的頻率變得更低，而一些常見詞匯出現(xiàn)的頻率則逐漸增加。

　　這種變化的結(jié)果就是，模型逐漸無法正確模擬真實世界的復(fù)雜性。隨著時間推移，這種錯誤會在迭代中被層層累積、逐漸放大，最終導(dǎo)致“模型崩潰”。這有點像生物學(xué)中“近親繁殖”會導(dǎo)致后代缺陷，如果不能保證基因庫的多樣性，最終會導(dǎo)致一個物種的崩潰。

　　研究人員還發(fā)現(xiàn)，由于訓(xùn)練數(shù)據(jù)被“污染”而導(dǎo)致“模型崩潰”的情況不止發(fā)生在大語言模型中，高斯混合模型、圖片生成器等也可能出現(xiàn)類似情況。

　　不過，應(yīng)對“模型崩潰”并非束手無策。研究人員發(fā)現(xiàn)，如果能在模型微調(diào)過程中保留10%左右的真實數(shù)據(jù)，崩潰就會發(fā)生得更緩慢。還可使用水印技術(shù)，將AI生成的數(shù)據(jù)與真實數(shù)據(jù)區(qū)分開來，這需要大型科技公司的協(xié)作。此外，在AI生成的文本重新進入數(shù)據(jù)池之前，可由人類先篩選過濾。

本文鏈接：http://www.www897cc.com/showinfo-16-103658-0.html用AI訓(xùn)練AI，可能越練越“傻”

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：我國學(xué)者合成新分子大幅提升鈣鈦礦電池穩(wěn)定性

下一篇：公共空間直播：要流量也要守底線

標簽：

熱門焦點

K60 Pro官方停產(chǎn) 第三方瞬間漲價

雖然沒有官方宣布，但Redmi的一些高管也已經(jīng)透露了，Redmi K60 Pro已經(jīng)停產(chǎn)且不會補貨，這一切都是為了即將到來的K60 Ultra鋪路，屬于廠家的正常操作。但有意思的是該機在停產(chǎn)之后
小米官宣：2023年上半年出貨量中國第一！

今日早間，小米電視官方微博帶來消息，稱2023年小米電視上半年出貨量達到了中國第一，同時還表示小米電視的巨屏風(fēng)暴即將開始。“公布一個好消息2023年#小米電視上半年出貨量中國
跑分安卓第一！Redmi K60至尊版8月發(fā)布！盧偉冰：目標年度性能之王

8月5日消息，Redmi K60至尊版將于8月發(fā)布，在此前舉行的戰(zhàn)略發(fā)布會上，官方該機將搭載搭載天璣9200+處理器，安兔兔V10跑分超177萬分，是目前安卓陣營最高的分數(shù)
如何使用JavaScript創(chuàng)建一只圖像放大鏡？

譯者 | 布加迪審校 | 重樓如果您曾經(jīng)瀏覽過購物網(wǎng)站，可能遇到過圖像放大功能。它可以讓您放大圖像的特定區(qū)域，以便瀏覽。結(jié)合這個小小的重要功能可以大大改善您網(wǎng)站的用戶體驗
攜眾多高端產(chǎn)品亮相ChinaJoy，小米帶來一場科技與人文的視聽盛宴

7月28日，全球數(shù)字娛樂領(lǐng)域最具知名度與影響力的年度盛會中國國際數(shù)碼互動娛樂展覽會（簡稱ChinaJoy）在上海新國際博覽中心盛大開幕。作為全球領(lǐng)先的科
小米MIX Fold 3配置細節(jié)曝光：搭載領(lǐng)先版驍龍8 Gen2+罕見5倍長焦

這段時間以來，包括三星、一加、榮耀等等有不少品牌旗下的最新折疊屏旗艦都得到了不少爆料，而小米新一代折疊屏旗艦——小米MIX Fold 3此前也屢屢被傳
郭明錤稱華為和江淮汽車合作開發(fā)問界MPV，定價100萬左右、計劃明年量產(chǎn)

8 月 1 日消息，郭明錤今天在 Medium 平臺發(fā)布博文，稱華為正在和江淮汽車合作，開發(fā)售價在 100 萬元的問界 MPV，預(yù)計在 2024 年第 2 季度量產(chǎn)，銷量目標為
華為開發(fā)者大會2023日程公開：開設(shè)鴻蒙HarmonyOS 4體驗區(qū)

IT之家 7 月 31 日消息，華為今日公布了 HDC.Together 開發(fā)者大會 2023 的詳細日程。整場大會將于 8 月 4 日-6 日之間舉行，屆時將發(fā)布最新一代鴻蒙 H
微軟發(fā)布Windows 11新版引入全新任務(wù)欄狀態(tài)

近日，微軟發(fā)布了Windows 11新版，而Build 22563更新主要引入了幾周前曝光的平板模式任務(wù)欄等，系統(tǒng)更流暢了。更新中，Windows 11加入了專門針對平板優(yōu)化的任務(wù)欄

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

用AI訓(xùn)練AI，可能越練越“傻”

K60 Pro官方停產(chǎn) 第三方瞬間漲價

小米官宣：2023年上半年出貨量中國第一！

跑分安卓第一！Redmi K60至尊版8月發(fā)布！盧偉冰：目標年度性能之王

如何使用JavaScript創(chuàng)建一只圖像放大鏡？

攜眾多高端產(chǎn)品亮相ChinaJoy，小米帶來一場科技與人文的視聽盛宴

小米MIX Fold 3配置細節(jié)曝光：搭載領(lǐng)先版驍龍8 Gen2+罕見5倍長焦

郭明錤稱華為和江淮汽車合作開發(fā)問界MPV，定價100萬左右、計劃明年量產(chǎn)

華為開發(fā)者大會2023日程公開：開設(shè)鴻蒙HarmonyOS 4體驗區(qū)

微軟發(fā)布Windows 11新版引入全新任務(wù)欄狀態(tài)

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

用AI訓(xùn)練AI，可能越練越“傻”

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

用AI訓(xùn)練AI，可能越練越“傻”