當前位置：首頁 > 元宇宙 > AI

LLM Attacks：新算法構建針對大型語言模型的對抗攻擊

來源：責編：時間：2023-08-15 18:47:25 291觀看

導讀8月7日消息，近日，卡內基梅隆大學(CMU)的研究人員發表了一項名為LLMAttacks的研究成果，引起了廣泛關注。該研究提出了一種全新的算法，用于構建針對各種大型語言模型(LLM)的對抗攻擊，包括ChatGPT、Claude和Bard等。通過這種

8月7日消息，近日，卡內基梅隆大學(CMU)的研究人員發表了一項名為LLMAttacks的研究成果，引起了廣泛關注。該研究提出了一種全新的算法，用于構建針對各種大型語言模型(LLM)的對抗攻擊，包括ChatGPT、Claude和Bard等。通過這種算法，攻擊者可以自動生成一系列提示后綴，繞過LLM的安全機制，并導致LLM輸出有害的響應。

據ITBEAR科技資訊了解，與傳統的“越獄”攻擊不同，CMU團隊設計的LLMAttacks算法采用了一個三步過程，自動創建有害提示后綴。首先，攻擊者需要創建一個目標令牌序列，類似于“Sure， here is (content ofquery)”，其中“content ofquery”是用戶實際的提示，要求有害響應。接下來，算法使用貪婪坐標梯度(GCG)方法，生成能導致LLM輸出目標序列的提示后綴，盡管這確實需要訪問LLM。

該研究還通過基準測試AdvBench評估了LLM Attacks算法的有效性。在這個基準測試上，LLMAttacks對名為Vicuna的LLM的成功率達到了驚人的88%，而基線對抗算法的成功率卻僅為25%。這表明新的LLMAttacks算法具有更高的攻擊成功率，可能對LLM提供商構成潛在威脅。

值得擔憂的是，這種對抗攻擊是否能被LLM提供商完全修復仍然是一個懸念。類似的對抗攻擊在計算機視覺領域已經被證明是一個難以解決的問題，可能與深度學習模型的本質相關。隨著ChatGPT和GPT-4等模型的發布，越來越多的針對這些模型的越獄技術也會出現，其中一些技術可以繞過模型的安全措施，并輸出有害響應。這對于廣泛應用和依賴這些強大AI模型的現代社會來說，無疑是一個需要引起重視的問題。

總的來說，卡內基梅隆大學的研究團隊提出的LLMAttacks算法為針對大型語言模型的對抗攻擊提供了一種新的、更高效的方法。然而，其對LLM安全性帶來的挑戰也需要得到深入研究和重視。隨著技術的不斷發展，保障AI模型的安全性將成為AI領域亟待解決的重要問題。

本文鏈接：http://www.www897cc.com/showinfo-45-878-0.htmlLLM Attacks：新算法構建針對大型語言模型的對抗攻擊

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：全球招聘辦公室設立數十崗位蘋果投入大語言模型研究

下一篇：生成式AI助理Aria：Opera重磅推出全新瀏覽器Opera One

標簽：

熱門焦點

新周期，誰在堅守窄門？

來源：錦緞今日的投資者恐怕已經忘記了，在OpenAI創造出ChatGPT這一殺器的前夜，生成式AI也曾經是一道窄門，窄到連馬斯克都差點失去了信心。在當時的輿論眼中，AGI的道路不夠性感，不夠
亞馬遜AIGC全家桶來襲，巨頭AI大亂戰都有什么殺手锏

此前，亞馬遜云科技發布多款AIGC產品，其中包括AI大模型服務Amazon Bedrock、人工智能計算實例Amazon EC2 Trn1n和Amazon EC2 Inf2、自研“泰坦”（Titan）AI大模型、軟件
中文在線的“元宇宙”故事，資本聽膩了？

被譽為“元宇宙”龍頭之一的中文在線，這下尷尬了。2022年1月11日，中國移動通信聯合會元宇宙產業委員會揭牌，接納涉足“元宇宙”的8家上市公司，包括中青寶、天下秀
避坑指南：遠離具有這些特性的NFT

關于NFT，在我們的文章中一直以來都是常駐嘉賓，不止因為NFT背后隱藏的潛力，更因為在這個NFT世界里冥冥之中仿佛有一雙幕后的手，OpenSea、庫里、ERC115、視覺中國、
星展銀行(DBS)計劃推出零售數字資產交易服務

2月14日消息，新加坡星展銀行CEO Piyush Gupta在財報會議上表示，計劃于2022年年底前推出零售數字資產交易服務。據悉，DBS于2021年初開設了機構數字資產交易平臺，全
2022年最具關注的9個頭像NFT項目

什么是 PFP NFT 項目？PFP NFT （個人資料圖片NFT）是一組獨特的數字收藏品，人們用來在互聯網平臺上代表自己。這些數字藝術作品通常是一系列可作為頭像的角色，在 Twit
韓國建立元宇宙生態系統，智度股份發布元宇宙社區Meta彼岸

財聯社|區塊鏈日報28日訊今日《元宇宙新鮮事》有：杭州第十三次黨代會報告指出抓緊布局元宇宙等未來產業；韓國科學信息通信技術部宣布投資1.85億美元建立元宇宙
NFT盜竊案：為什么NFT市場被盜竊和黑客所困擾？

Block-806NFT的增長值得關注。許多人愿意為數字藝術支付數百萬美元，世界正在走向數字化。報告顯示，NFT市場和NFT收藏從2020年的1.06億美元增加到了2021年的442億
在元宇宙開會是什么樣一種體驗

空間就是一切還記得面對面的會議嗎？就在不久前，與會者需要飛到遙遠的目的地，并進行鼓舞人心的對話、網絡、免費食物，甚至可能會有一兩個很好的小組討論。隨之而來

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

LLM Attacks：新算法構建針對大型語言模型的對抗攻擊

新周期，誰在堅守窄門？

亞馬遜AIGC全家桶來襲，巨頭AI大亂戰都有什么殺手锏

中文在線的“元宇宙”故事，資本聽膩了？

避坑指南：遠離具有這些特性的NFT

星展銀行(DBS)計劃推出零售數字資產交易服務

2022年最具關注的9個頭像NFT項目

韓國建立元宇宙生態系統，智度股份發布元宇宙社區Meta彼岸

NFT盜竊案：為什么NFT市場被盜竊和黑客所困擾？

在元宇宙開會是什么樣一種體驗

最新推薦

以太坊倫敦升級后，隨之生效的以太坊EIP-1559是什么？

暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎？

過去女性在互聯網領域是半邊天，在Web3，將會是整片天！

下一個黃金賽道？NFT的碎片化!

以用戶為中心，Web3和區塊鏈如何將用戶放在首位

韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

猜你喜歡

熱門推薦

相關資訊