當前位置：首頁 > 科技 > 互聯網

研究人員發布了針對ChatGPT和其他LLM的攻擊算法

來源：責編：時間：2023-08-09 23:02:38 355觀看

導讀卡內基梅隆大學（CMU）的研究人員發表了 LLM Attacks，這是一種用于構建針對各種大型語言模型(LLM)的對抗攻擊的算法，包括 ChatGPT、Claude 和 Bard。這些攻擊是自動生成的，對 GPT-3.5和 GPT-4的成功

卡內基梅隆大學（CMU）的研究人員發表了 LLM Attacks，這是一種用于構建針對各種大型語言模型(LLM)的對抗攻擊的算法，包括 ChatGPT、Claude 和 Bard。這些攻擊是自動生成的，對 GPT-3.5和 GPT-4的成功率為84%，對 PaLM-2的成功率為66%。

與大多數通過試錯手動構建的“越獄”攻擊不同，CMU 團隊設計了一個三步過程，自動生成提示后綴，可以繞過 LLM 的安全機制，并導致有害的響應。這些提示也是可轉移的，意味著一個給定的后綴通常可以作用于許多不同的 LLM，甚至是閉源模型。為了衡量算法的有效性，研究人員創建了一個名為 AdvBench 的基準;在這個基準上評估時，LLM Attacks 對 Vicuna 的成功率為88%，而基線對抗算法的成功率為25%。根據 CMU 團隊的說法:

也許最令人擔憂的是，這種行為是否能夠被 LLM 提供商完全修復。類似的對抗攻擊在計算機視覺領域已經被證明是一個非常難以解決的問題，在過去的10年里。有可能深度學習模型的本質使得這種威脅不可避免。因此，我們認為在增加對這種 AI 模型的使用和依賴時，應該考慮到這些因素。

隨著 ChatGPT 和 GPT-4的發布，許多越獄這些模型的技術出現了，它們由可以導致模型繞過其安全措施并輸出潛在有害響應的提示組成。雖然這些提示通常是通過實驗發現的，但 LLM Attacks 算法提供了一種自動創建它們的方法。第一步是創建一個目標令牌序列:“Sure， here is （content of query）”，其中“content of query”是用戶實際的提示，要求有害響應。

接下來，算法通過使用貪婪坐標梯度（GCG）方法，生成一個提示后綴，可以導致 LLM 輸出目標序列。雖然這確實需要訪問 LLM。

本文鏈接：http://www.www897cc.com/showinfo-21-5050-0.html研究人員發布了針對ChatGPT和其他LLM的攻擊算法

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：檸萌影視預計2023上半年凈利潤超1.29億元

下一篇：昆侖萬維旗下Opera生成式AI服務海外用戶數突破100萬

標簽：

熱門焦點

Redmi Buds 4開箱簡評：才199還有降噪可以無腦入

在上個月舉辦的Redmi Note11T Pro系列新機發布會上，除了兩款手機新品之外，Redmi還帶來了兩款TWS真無線藍牙耳機產品，Redmi Buds 4和Redmi Buds 4 Pro，此前我們在Redmi Note11T
在線圖片編輯器，支持PSD解析、AI摳圖等

自從我上次分享一個人開發仿造稿定設計的圖片編輯器到現在，不知不覺已過去一年時間了，期間我經歷了裁員失業、面試找工作碰壁，寒冬下一直沒有很好地履行計劃.....這些就放在日
三萬字盤點 Spring 九大核心基礎功能

大家好，我是三友~~今天來跟大家聊一聊Spring的9大核心基礎功能。話不多說，先上目錄：圖片友情提示，本文過長，建議收藏，嘿嘿嘿！一、資源管理資源管理是Spring的一個核心的基礎功能，不
重估百度丨大模型，能撐起百度的“今天”嗎?

自象限原創作者｜程心羅輯2023年之前，對于自己的“今天”，百度也很迷茫。“新業務到 2022 年底還是 0，希望 2023 年出來一個 1。”這是2022年底，李彥宏
華為Mate60標準版細節曝光：經典星環相機模組回歸

這段時間以來，關于華為新旗艦的爆料日漸密集。據此前多方爆料，今年華為將開始恢復一年雙旗艦戰略，除上半年推出的P60系列外，往年下半年的Mate系列也將
iQOO Neo8 Pro搶先上架：首發天璣9200+ 安卓性能之王

經過了一段時間的密集爆料，昨日iQOO官方如期對外宣布：將于5月23日推出全新的iQOO Neo8系列新品，官方稱這是一款擁有旗艦級性能調校的作品。隨著發布時
iQOO Neo8 Pro真機諜照曝光：天璣9200+和V1+旗艦雙芯加持

去年10月，iQOO推出了iQOO Neo7系列機型，不僅搭載了天璣9000+，而且是同價位唯一一款天璣9000+直屏旗艦，一經上市便受到了用戶的廣泛關注。在時隔半年后，
三翼鳥智能家居亮相電博會，讓用戶體驗更真實

2021電博會在青島國際會展中心開幕中，三翼鳥直接把“家”搬到了現場，成為了展會的一大看點。這也是三翼鳥繼9月9日發布了行業首個一站式定制智慧家平臺后的
榮耀Magic4 至臻版首創智慧隱私通話強勁影音系統

2022年第一季度臨近尾聲，在該季度內，許多品牌陸續發布自己的最新產品，讓大家從全新的角度來了解當今的手機技術。手機是電子設備中，更新迭代十分迅速的一款產品，基

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

研究人員發布了針對ChatGPT和其他LLM的攻擊算法

Redmi Buds 4開箱簡評：才199還有降噪可以無腦入

在線圖片編輯器，支持PSD解析、AI摳圖等

三萬字盤點 Spring 九大核心基礎功能

重估百度丨大模型，能撐起百度的“今天”嗎?

華為Mate60標準版細節曝光：經典星環相機模組回歸

iQOO Neo8 Pro搶先上架：首發天璣9200+ 安卓性能之王

iQOO Neo8 Pro真機諜照曝光：天璣9200+和V1+旗艦雙芯加持

三翼鳥智能家居亮相電博會，讓用戶體驗更真實

榮耀Magic4 至臻版首創智慧隱私通話強勁影音系統

最新推薦

猜你喜歡

熱門推薦

相關資訊