日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁(yè) > 元宇宙 > AI

LLM Attacks:新算法構(gòu)建針對(duì)大型語(yǔ)言模型的對(duì)抗攻擊

來(lái)源: 責(zé)編: 時(shí)間:2023-08-15 18:47:25 314觀看
導(dǎo)讀8月7日消息,近日,卡內(nèi)基梅隆大學(xué)(CMU)的研究人員發(fā)表了一項(xiàng)名為L(zhǎng)LMAttacks的研究成果,引起了廣泛關(guān)注。該研究提出了一種全新的算法,用于構(gòu)建針對(duì)各種大型語(yǔ)言模型(LLM)的對(duì)抗攻擊,包括ChatGPT、Claude和Bard等。通過(guò)這種

8月7日消息,近日,卡內(nèi)基梅隆大學(xué)(CMU)的研究人員發(fā)表了一項(xiàng)名為L(zhǎng)LMAttacks的研究成果,引起了廣泛關(guān)注。該研究提出了一種全新的算法,用于構(gòu)建針對(duì)各種大型語(yǔ)言模型(LLM)的對(duì)抗攻擊,包括ChatGPT、Claude和Bard等。通過(guò)這種算法,攻擊者可以自動(dòng)生成一系列提示后綴,繞過(guò)LLM的安全機(jī)制,并導(dǎo)致LLM輸出有害的響應(yīng)。j5j28資訊網(wǎng)——每日最新資訊28at.com

據(jù)ITBEAR科技資訊了解,與傳統(tǒng)的“越獄”攻擊不同,CMU團(tuán)隊(duì)設(shè)計(jì)的LLMAttacks算法采用了一個(gè)三步過(guò)程,自動(dòng)創(chuàng)建有害提示后綴。首先,攻擊者需要?jiǎng)?chuàng)建一個(gè)目標(biāo)令牌序列,類(lèi)似于“Sure, here is (content ofquery)”,其中“content ofquery”是用戶(hù)實(shí)際的提示,要求有害響應(yīng)。接下來(lái),算法使用貪婪坐標(biāo)梯度(GCG)方法,生成能導(dǎo)致LLM輸出目標(biāo)序列的提示后綴,盡管這確實(shí)需要訪(fǎng)問(wèn)LLM。j5j28資訊網(wǎng)——每日最新資訊28at.com

該研究還通過(guò)基準(zhǔn)測(cè)試AdvBench評(píng)估了LLM Attacks算法的有效性。在這個(gè)基準(zhǔn)測(cè)試上,LLMAttacks對(duì)名為Vicuna的LLM的成功率達(dá)到了驚人的88%,而基線(xiàn)對(duì)抗算法的成功率卻僅為25%。這表明新的LLMAttacks算法具有更高的攻擊成功率,可能對(duì)LLM提供商構(gòu)成潛在威脅。j5j28資訊網(wǎng)——每日最新資訊28at.com

值得擔(dān)憂(yōu)的是,這種對(duì)抗攻擊是否能被LLM提供商完全修復(fù)仍然是一個(gè)懸念。類(lèi)似的對(duì)抗攻擊在計(jì)算機(jī)視覺(jué)領(lǐng)域已經(jīng)被證明是一個(gè)難以解決的問(wèn)題,可能與深度學(xué)習(xí)模型的本質(zhì)相關(guān)。隨著ChatGPT和GPT-4等模型的發(fā)布,越來(lái)越多的針對(duì)這些模型的越獄技術(shù)也會(huì)出現(xiàn),其中一些技術(shù)可以繞過(guò)模型的安全措施,并輸出有害響應(yīng)。這對(duì)于廣泛應(yīng)用和依賴(lài)這些強(qiáng)大AI模型的現(xiàn)代社會(huì)來(lái)說(shuō),無(wú)疑是一個(gè)需要引起重視的問(wèn)題。j5j28資訊網(wǎng)——每日最新資訊28at.com

總的來(lái)說(shuō),卡內(nèi)基梅隆大學(xué)的研究團(tuán)隊(duì)提出的LLMAttacks算法為針對(duì)大型語(yǔ)言模型的對(duì)抗攻擊提供了一種新的、更高效的方法。然而,其對(duì)LLM安全性帶來(lái)的挑戰(zhàn)也需要得到深入研究和重視。隨著技術(shù)的不斷發(fā)展,保障AI模型的安全性將成為AI領(lǐng)域亟待解決的重要問(wèn)題。j5j28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-878-0.htmlLLM Attacks:新算法構(gòu)建針對(duì)大型語(yǔ)言模型的對(duì)抗攻擊

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 全球招聘辦公室設(shè)立數(shù)十崗位 蘋(píng)果投入大語(yǔ)言模型研究

下一篇: 生成式AI助理Aria:Opera重磅推出全新瀏覽器Opera One

標(biāo)簽:
  • 熱門(mén)焦點(diǎn)
  • 元宇宙里賣(mài)酸奶,好炸裂的操作!

    作者 | 李東陽(yáng) 來(lái)源 | 首席營(yíng)銷(xiāo)官有沒(méi)有發(fā)現(xiàn),當(dāng)下的熱搜出現(xiàn)一個(gè)有意思的現(xiàn)象,那就是“情懷”不知不覺(jué)成為了主流,爺青回話(huà)題討論性非常高。前有名偵探柯南和優(yōu)衣庫(kù)
  • 元宇宙火熱的當(dāng)下,我們?cè)撊绾巍吧砼R其境”的體驗(yàn)元宇宙?

    元宇宙的余熱依然沒(méi)有過(guò)去,甚至大有星星之火開(kāi)啟燎原之勢(shì),元宇宙本身也從殿堂走向了民間,我們可以看到一些企業(yè)開(kāi)始了元宇宙的探索,諸如中國(guó)電信全資控股子公司天
  • 搭上“谷愛(ài)凌”,“柳夜熙們”站上風(fēng)口?

    作者:張琳 曹楊從“永不塌房”的藝人到頻頻亮相北京冬奧會(huì),作為元宇宙細(xì)分賽道之一的虛擬數(shù)字人又火了一把。2月7日,即谷愛(ài)凌摘得冬奧會(huì)自由式滑雪大跳臺(tái)金牌的
  • 2022年最具關(guān)注的9個(gè)頭像NFT項(xiàng)目

    什么是 PFP NFT 項(xiàng)目?PFP NFT (個(gè)人資料圖片NFT)是一組獨(dú)特的數(shù)字收藏品,人們用來(lái)在互聯(lián)網(wǎng)平臺(tái)上代表自己。這些數(shù)字藝術(shù)作品通常是一系列可作為頭像的角色,在 Twit
  • 韓國(guó)國(guó)民銀行將推出韓國(guó)首個(gè)加密貨幣 ETF

    韓國(guó)國(guó)民銀行(Kookmin Bank)計(jì)劃發(fā)行該國(guó)首個(gè)以散戶(hù)投資者為主要關(guān)注點(diǎn)的加密貨幣投資基金。根據(jù)公告,該銀行正在等待政府批準(zhǔn),并已建立一個(gè)準(zhǔn)備就緒的數(shù)字資產(chǎn)
  • 下一個(gè)黃金賽道?NFT的碎片化!

    碎片化可能是我們一生中最重要的一個(gè)投資趨勢(shì),碎片化本身并不新鮮。它已經(jīng)存在了400年之久。早在1602年,荷蘭東印度公司是歷史上第一家在公共證券交易所上市的公
  • Meta 在衰落嗎?

    扎克伯格已經(jīng)很久沒(méi)有出現(xiàn)在公眾視野里了,近日,他罕見(jiàn)的接受播客采訪(fǎng),在兩個(gè)小時(shí)的時(shí)間里暢談了Meta、Facebook、Instagram、元宇宙的未來(lái)。正方觀點(diǎn):是的阿倫·達(dá)
  • 為什么元宇宙將永遠(yuǎn)改變體育和你的生活?

    自從Facebook更名為Meta以來(lái),Metaverse這個(gè)詞已經(jīng)被大家所熟知。但是當(dāng)Metaverse仍然被許多人視為一個(gè)虛擬的平行世界時(shí),一些項(xiàng)目已經(jīng)顯示出Metaverse將如何永遠(yuǎn)
  • 王老吉啟動(dòng)元宇宙“吉空間”,HTC發(fā)布元宇宙應(yīng)用VIVERSE

    今日《元宇宙新鮮事》有:王老吉啟動(dòng)元宇宙“吉空間”;HTC發(fā)布元宇宙應(yīng)用VIVERSE;Meta將在馬德里構(gòu)建一個(gè)元宇宙創(chuàng)新中心;央視網(wǎng)《新聞+》推出系列視頻《聊聊元宇宙
Top 主站蜘蛛池模板: 涞源县| 惠安县| 朝阳区| 奉贤区| 泾源县| 景东| 沙雅县| 吴忠市| 绥芬河市| 沙湾县| 贡嘎县| 陆丰市| 偏关县| 长寿区| 营口市| 灵武市| 吐鲁番市| 磴口县| 白城市| 乐业县| 运城市| 宁都县| 博乐市| 板桥市| 济宁市| 多伦县| 黎城县| 饶阳县| 河曲县| 太白县| 黄龙县| 扎鲁特旗| 松原市| 保山市| 松滋市| 澄江县| 高平市| 青冈县| 延长县| 嘉义县| 集贤县|