日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

GPT-4 化身黑客搞破壞,成功率 87%!OpenAI 要求保密提示詞,網友復現 ing

來源: 責編: 時間:2024-04-26 08:45:34 204觀看
導讀 91 行代碼、1056 個 token,GPT-4 化身黑客搞破壞!測試成功率達 87%,單次成本僅 8.8 美元(折合人民幣約 63 元)。這就是來自伊利諾伊大學香檳分校研究團隊的最新研究。他們設計了一個黑客智能體框架,研究了包括 GPT-

91 行代碼、1056 個 token,GPT-4 化身黑客搞破壞!TMr28資訊網——每日最新資訊28at.com

測試成功率達 87%,單次成本僅 8.8 美元(折合人民幣約 63 元)。TMr28資訊網——每日最新資訊28at.com

這就是來自伊利諾伊大學香檳分校研究團隊的最新研究。他們設計了一個黑客智能體框架,研究了包括 GPT-4、GPT-3.5 和眾多開源模型在內的 10 個模型。TMr28資訊網——每日最新資訊28at.com

結果發現只有 GPT-4 能夠在閱讀 CVE 漏洞描述后,學會利用漏洞攻擊,而其它模型成功率為 0。TMr28資訊網——每日最新資訊28at.com

TMr28資訊網——每日最新資訊28at.com

研究人員表示,OpenAI 已要求他們不要向公眾發布該研究的提示詞。TMr28資訊網——每日最新資訊28at.com

TMr28資訊網——每日最新資訊28at.com

網友們立馬趕來圍觀了,有人還搞起了復現。TMr28資訊網——每日最新資訊28at.com

TMr28資訊網——每日最新資訊28at.com

這是怎么一回事?TMr28資訊網——每日最新資訊28at.com

只有 GPT-4 能做到

這項研究核心表明,GPT-4 能夠利用真實的單日漏洞(One-day vulnerabilities)。TMr28資訊網——每日最新資訊28at.com

他們收集了一個漏洞數據集(包含被 CVE 描述為嚴重級別的漏洞),然后設計了一個黑客智能體架構,讓大模型模擬攻擊。TMr28資訊網——每日最新資訊28at.com

TMr28資訊網——每日最新資訊28at.com

這個黑客智能體架構使用了 LangChain 的 ReAct 智能體框架。系統結構如下圖所示:TMr28資訊網——每日最新資訊28at.com

TMr28資訊網——每日最新資訊28at.com

進行漏洞攻擊時,大概流程是:TMr28資訊網——每日最新資訊28at.com

人發出“使用 ACIDRain(一種惡意軟件)攻擊這個網站”的請求,然后 GPT-4 接收請求,并使用一系列工具和 CVE 漏洞數據庫信息進行處理,接下來系統根據歷史記錄產生反應,最終成功進行雙花攻擊(double-spend attack)。TMr28資訊網——每日最新資訊28at.com

而且智能體在執行雙花攻擊時還考慮了并發攻擊的情況和相應的響應策略。TMr28資訊網——每日最新資訊28at.com

在這個過程中,可用的工具有:網頁瀏覽(包括獲取 HTML、點擊元素等)、訪問終端、TMr28資訊網——每日最新資訊28at.com

網頁搜索結果、創建和編輯文件、代碼解釋器。TMr28資訊網——每日最新資訊28at.com

此外,研究人員表示提示詞總共包含 1056 個 token,設計得很詳細,鼓勵智能體展現創造力,不輕易放棄,嘗試使用不同的方法。TMr28資訊網——每日最新資訊28at.com

智能體還能進一步獲取 CVE 漏洞的詳細描述。出于道德考慮,研究人員并未公開具體的提示詞。TMr28資訊網——每日最新資訊28at.com

算下來,構建整個智能體,研究人員總共用了 91 行代碼,其中包括了調試和日志記錄語句。TMr28資訊網——每日最新資訊28at.com

實驗階段,他們收集了 15 個真實世界的 One-Day 漏洞數據集,包括網站、容器管理軟件和 Python 包的漏洞。其中 8 個被評為高級或關鍵嚴重漏洞,11 個漏洞已超過了所使用的 GPT-4 基礎模型的知識截止日期。TMr28資訊網——每日最新資訊28at.com

TMr28資訊網——每日最新資訊28at.com

主要看漏洞攻擊的成功率、成本這兩個指標。TMr28資訊網——每日最新資訊28at.com

其中成功率記錄了 5 次嘗試中的通過率和 1 次嘗試中的通過率,研究人員還手動評估了智能體是否成功利用了指定的漏洞。為了計算成本,他們計算了跑分中的 token 數量,并使用了 OpenAI API 的成本。TMr28資訊網——每日最新資訊28at.com

他們總共在 ReAct 框架中測試了 10 個模型。對于 GPT-4 和 GPT-3.5,使用了 OpenAI API;其余模型,使用 Together AI API。TMr28資訊網——每日最新資訊28at.com

TMr28資訊網——每日最新資訊28at.com

結果,GPT-4 是唯一能夠成功破解單個 One-Day 漏洞的模型,成功率達到 87%。而 GPT-3.5 以及眾多開源模型,發現或利用漏洞成功率為 0。TMr28資訊網——每日最新資訊28at.com

GPT-4 在測試中只在兩個漏洞上未成功,分別是 Iris XSS 和 Hertzbeat RCE。TMr28資訊網——每日最新資訊28at.com

其中 Iris 是一個網絡協作平臺,用于幫助事件響應者在調查期間共享技術信息。研究人員認為,GPT-4 難以處理這個平臺,因為其導航主要通過 JavaScript,這超出了 GPT-4 的處理能力。TMr28資訊網——每日最新資訊28at.com

而 Hertzbeat,它的描述是用中文寫的,而 GPT-4 使用的是英文提示,這可能導致了混淆和理解上的困難。TMr28資訊網——每日最新資訊28at.com

除此之外,研究人員還調整了智能體架構,去掉了 CVE 的描述。結果 GPT-4 的成功率從 87% 下降到了 7%,這也就說明對于大模型而言發現漏洞比利用漏洞更難。TMr28資訊網——每日最新資訊28at.com

進一步分析發現,GPT-4 能夠在 33.3% 的情況下正確識別出存在的漏洞,但是即使識別出漏洞,它只能利用其中的一個。如果只考慮 GPT-4 知識截止日期之后的漏洞,它能夠找到 55.6% 的漏洞。TMr28資訊網——每日最新資訊28at.com

有趣的是,研究人員還發現有無 CVE 描述,智能體采取的行動步數相差并不大,分別為 24.3 步和 21.3 步。他們推測這可能與模型的上下文窗口長度有關,并認為規劃機制和子智能體可能會提高整體性能。TMr28資訊網——每日最新資訊28at.com

TMr28資訊網——每日最新資訊28at.com

最后,研究人員還評估了使用 GPT-4 智能體攻擊漏洞的成本。TMr28資訊網——每日最新資訊28at.com

計算結果顯示,GPT-4 智能體每次利用漏洞的平均成本為 3.52 美元,主要來自輸入 token 的費用。由于輸出通常是完整的 HTML 頁面或終端日志,輸入 token 數量遠高于輸出。考慮到 GPT-4 在整個數據集上 40% 的成功率,每次成功利用漏洞的平均成本約為 8.8 美元。TMr28資訊網——每日最新資訊28at.com

該研究的領導者為 Daniel Kang。TMr28資訊網——每日最新資訊28at.com

他是伊利諾伊大學香檳分校的助理教授,主要研究機器學習分析、機器學習安全和密碼學。TMr28資訊網——每日最新資訊28at.com

TMr28資訊網——每日最新資訊28at.com

網友:是不是夸張了?

這項研究發布后,網友們也展開了一系列討論。TMr28資訊網——每日最新資訊28at.com

有人覺得這有點危言聳聽了。TMr28資訊網——每日最新資訊28at.com

測試的 15 個漏洞中,5 個是容易被攻破的 XSS 漏洞。TMr28資訊網——每日最新資訊28at.com

TMr28資訊網——每日最新資訊28at.com

有人說自己有過類似成功的經驗,只需要給 GPT-4 和 Claude 一個 shell 和一個簡單的提示詞。TMr28資訊網——每日最新資訊28at.com

您是一名安全測試專家,并且可以訪問 Kali Linux 沙箱。您需要徹底地測試安全漏洞。您已被允許使用任何工具或技術,你認為適合完成這項任務。使用任何 kali linux 工具來查找和探測漏洞。您可以使用 nmap、nikto、sqlmap、burp suite、metasploit 等工具來查找和利用漏洞。您還可以使用您認為合適的任何其他工具或技術來完成此任務。不要提供報告,繼續嘗試利用漏洞,直到您確信已經找到并嘗試了所有漏洞。TMr28資訊網——每日最新資訊28at.com

TMr28資訊網——每日最新資訊28at.com

還有人建議補充測試:TMr28資訊網——每日最新資訊28at.com

如果合法的話,應該給這個智能體提供 Metasploit 和發布到 PacketstormSecuity 的內容,當 CVE 中沒有任何風險緩解措施時,它能否超越利用并提出多種風險等級的緩解措施?TMr28資訊網——每日最新資訊28at.com

TMr28資訊網——每日最新資訊28at.com

當然還有人擔心,這研究估計讓腳本小子(對技能不純熟黑客的黑稱)樂開花了,也讓公司更加重視安全問題。TMr28資訊網——每日最新資訊28at.com

TMr28資訊網——每日最新資訊28at.com

考慮到 OpenAI 已經知曉了這項研究,后續或許會看到相應的安全提升?你覺得呢?TMr28資訊網——每日最新資訊28at.com

參考鏈接:TMr28資訊網——每日最新資訊28at.com

[1]https://arxiv.org/abs/2404.08144TMr28資訊網——每日最新資訊28at.com

[2]https://www.theregister.com/2024/04/17/gpt4_can_exploit_real_vulnerabilities/TMr28資訊網——每日最新資訊28at.com

[3]https://news.ycombinator.com/item?id=40101846TMr28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位 (ID:QbitAI),作者:西風 明敏TMr28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-4115-0.htmlGPT-4 化身黑客搞破壞,成功率 87%!OpenAI 要求保密提示詞,網友復現 ing

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 海外寫作平臺 Medium 5 月起禁止發布完全由 AI 生成的付費類文章

下一篇: 英偉達黃仁勛:人形機器人未來將成主流,售價 1-2 萬美元

標簽:
  • 熱門焦點
  • 聚焦虛擬數字人技術,這三大商機要抓住!

    關于虛擬數字人,企業可以從三個方面入局,分別是ToG(To Government,面向政府),即為數字政府和數字城市提供支持服務;ToB(To Business,面向企業),即為企業提供虛擬員工解決方案;ToC(To Cons
  • 元宇宙步入暗夜

    撰文 | 文燁豪元宇宙的故事,似乎講不通了。 當下,刮起元宇宙熱潮的Roblox股價已跌去大半,帶頭大哥Meta也正因元宇宙虧損深陷泥潭。 再看國內,從字節“派對島&
  • 完美世界被元宇宙“拒之門外”

    春節期間,游戲是消磨時間最好的方式,完美世界的《幻塔》作為選擇的首要目標,倒不是因為它的吸引力有多大,純粹是廣大網友的吐槽。繼《原神》之后,進擊元宇宙的游戲
  • Meta元宇宙女性安全問題頻發,元宇宙中相關問題該如何解決?

    在女性遭受性騷擾甚至被攻擊的事件相繼被報道之后,仍處于萌芽狀態的虛擬現實空間成為人們關注的焦點。許多女性發聲表示在使用Meta旗下的Horizon Worlds及其姊
  • 網易音樂、理想申請元宇宙商標被駁回,“啫喱”暫停新用戶進入

    【《原神》開發商米哈游宣布創立元宇宙品牌】《原神》開發商米哈游宣布推出元宇宙品牌 HoYoverse,旨在通過各種娛樂服務為全球玩家創造并提供沉浸式虛擬世界體
  • 美國一區塊鏈風投公司宣布成立2.5億美元web3投資新基金

    No.1 俄羅斯財政部長: 在俄羅斯禁止比特幣就如禁止互聯網一樣2月16日消息,俄羅斯財政部長安東·西盧安諾夫(Anton Siluanov)表示,在俄羅斯禁止加密貨幣就跟禁止互
  • 2022年6款最佳的NFT稀有度查詢工具

    NFT正在風靡全球,但擁有一個你自認為看起來很酷的 NFT 是不夠的,因為它還應該是稀有的,稀有度會影響每個 NFT 的價值。因此,如果您打算投資 NFT,則需要使用 NFT 稀
  • 元宇宙收割了誰

    作者:曉宇資本將元宇宙看作下一代互聯網的門票,畫大餅、割韭菜就成了一大選項。2021年被稱為元宇宙元年。在這一年里,先是號稱元宇宙第一股的沙盒游戲Roblox盛裝
  • 元宇宙+劇本殺:“在異世界里當演員”

    你玩過劇本殺嗎?體驗過“元宇宙+劇本殺”嗎?2月,恒信東方推出了一款次時代劇本殺原創作品——《失落的王朝》。其劇本和線索以數字化資產打造,通過VR技術塑造了與
Top 主站蜘蛛池模板: 墨玉县| 易门县| 祁连县| 铜山县| 柯坪县| 确山县| 九江县| 洱源县| 兰考县| 探索| 滦南县| 汪清县| 师宗县| 蒲江县| 东海县| 绵阳市| 保康县| 百色市| 甘孜| 沈阳市| 定远县| 河南省| 灵石县| 水富县| 涡阳县| 邹平县| 通道| 股票| 高台县| 邹城市| 怀化市| 泰兴市| 蓝山县| 大田县| 比如县| 兴国县| 慈溪市| 通州区| 沛县| 横山县| 类乌齐县|