日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 科技  > 資訊

科企競逐新技術(shù)以防AI“越獄”

來源: 責(zé)編: 時間:2025-03-17 11:23:33 53觀看
導(dǎo)讀  隨著人工智能(AI)技術(shù)的快速普及,新的安全漏洞和“越獄”方法層出不窮。這讓黑客更容易濫用AI系統(tǒng),實(shí)施網(wǎng)絡(luò)攻擊、傳播不當(dāng)信息、制造安全風(fēng)險(xiǎn),甚至引發(fā)重大犯罪行為。鑒于此,全球科技巨頭競相開發(fā)新技術(shù),力求在保持AI模

  隨著人工智能(AI)技術(shù)的快速普及,新的安全漏洞和“越獄”方法層出不窮。這讓黑客更容易濫用AI系統(tǒng),實(shí)施網(wǎng)絡(luò)攻擊、傳播不當(dāng)信息、制造安全風(fēng)險(xiǎn),甚至引發(fā)重大犯罪行為。鑒于此,全球科技巨頭競相開發(fā)新技術(shù),力求在保持AI模型功能性的同時,有效減少其被濫用的風(fēng)險(xiǎn)。hij28資訊網(wǎng)——每日最新資訊28at.com

hij28資訊網(wǎng)——每日最新資訊28at.com

圖片來源:IBM網(wǎng)站hij28資訊網(wǎng)——每日最新資訊28at.com

AI“越獄”日益猖獗hij28資訊網(wǎng)——每日最新資訊28at.com

  IBM網(wǎng)站對AI“越獄”是這樣解釋的:當(dāng)黑客或別有用心之人利用AI系統(tǒng)中的漏洞,繞過道德準(zhǔn)則,操縱AI模型生成非法或危險(xiǎn)信息時,便視為AI“越獄”。黑客慣常利用的AI“越獄”手段包括提示詞植入、角色扮演誘導(dǎo)、現(xiàn)在就做任何事(DAN)、敏感詞拆分等。hij28資訊網(wǎng)——每日最新資訊28at.com

  提示詞植入指在輸入中植入特定指令或改變輸入的語義結(jié)構(gòu),誘導(dǎo)模型執(zhí)行非期望操作或生成錯誤結(jié)果;在角色扮演誘導(dǎo)中,黑客會讓AI扮演特定角色,繞過內(nèi)容過濾器生成信息;DAN則是ChatGPT的一種特殊運(yùn)行模式,在此模式下,ChatGPT獲得了超越其原有道德和倫理限制的能力,能回答一些正常模式下無法回答的問題;敏感詞拆分則指將敏感詞拆分成子字符串以規(guī)避檢查。hij28資訊網(wǎng)——每日最新資訊28at.com

  這些技術(shù)通過精心設(shè)計(jì)的提示,引導(dǎo)模型偏離預(yù)定的安全防護(hù)規(guī)則,生成潛在的有害內(nèi)容,甚至引發(fā)數(shù)據(jù)泄露、系統(tǒng)失控等嚴(yán)重后果。hij28資訊網(wǎng)——每日最新資訊28at.com

  研究發(fā)現(xiàn),在無保護(hù)措施的情境下,生成式AI“越獄”攻擊的成功率高達(dá)20%。平均而言,攻擊者僅需42秒及5次交互便能突破防線。在某些情況下,攻擊甚至在短短4秒內(nèi)就能完成。這些發(fā)現(xiàn)凸顯了當(dāng)前生成式AI模型算法中存在重大漏洞,實(shí)時防止漏洞的難度很大。hij28資訊網(wǎng)——每日最新資訊28at.com

  IBM網(wǎng)站指出,AI“越獄”事件愈發(fā)普遍,要?dú)w因于AI技術(shù)的飛速進(jìn)步、AI工具的可獲取性日益提升,以及對未經(jīng)過濾輸出的需求不斷增長等。安全專家認(rèn)為,生成式聊天機(jī)器人的易用性,使缺乏相關(guān)知識背景的普通人也能嘗試獲取危險(xiǎn)信息。hij28資訊網(wǎng)——每日最新資訊28at.com

  為AI設(shè)立“防護(hù)欄”hij28資訊網(wǎng)——每日最新資訊28at.com

  為更好地推動AI發(fā)展,確保其安全可控,增強(qiáng)客戶信任,包括微軟和元宇宙平臺等公司在內(nèi)的科技巨頭,正竭力防止AI“越獄”。hij28資訊網(wǎng)——每日最新資訊28at.com

  據(jù)英國《金融時報(bào)》報(bào)道,AI初創(chuàng)公司Anthropic推出了一款名為“憲法分類器”的新系統(tǒng),其可作為大語言模型的保護(hù)層,監(jiān)測輸入和輸出內(nèi)容是否存在有害信息,確保用戶免受不良信息的侵?jǐn)_。hij28資訊網(wǎng)——每日最新資訊28at.com

  這一解決方案基于一套被稱為“憲法”規(guī)則的體系。這些規(guī)則明確界定了信息的允許范圍與限制邊界,并可根據(jù)實(shí)際需求靈活調(diào)整,以涵蓋不同類型的材料。hij28資訊網(wǎng)——每日最新資訊28at.com

  為驗(yàn)證該系統(tǒng)的實(shí)效,Anthropic公司提供了15000美元的“漏洞賞金”。重賞之下,183名測試人員歷時3000多個小時,嘗試突破防御。在“憲法分類器”的保駕護(hù)航下,該公司的“克勞德3.5”模型抵御了超過95%的惡意嘗試。而在沒有這道防護(hù)網(wǎng)的情況下,該模型的拒絕率僅為14%。hij28資訊網(wǎng)——每日最新資訊28at.com

  無獨(dú)有偶,微軟去年3月推出了“提示詞防護(hù)盾”。這一創(chuàng)新工具能夠?qū)崟r偵測并有效阻止誘導(dǎo)AI模型“越獄”的“提示詞攻擊”。微軟還攻克了“間接提示詞輸入”這一難題,即防止黑客將惡意指令悄然插入模型的訓(xùn)練數(shù)據(jù)中,從而避免模型執(zhí)行不當(dāng)操作。hij28資訊網(wǎng)——每日最新資訊28at.com

  值得一提的是,微軟還推出了一項(xiàng)新功能:當(dāng)AI模型編造內(nèi)容或產(chǎn)生錯誤反應(yīng)時,它會迅速提醒用戶。hij28資訊網(wǎng)——每日最新資訊28at.com

  2024年底,美國加州大學(xué)伯克利分校與元宇宙平臺公司攜手,推出了一種通用防御框架,以有效應(yīng)對策略性植入的提示詞攻擊,為AI的安全防護(hù)再添一道屏障。hij28資訊網(wǎng)——每日最新資訊28at.com

  技術(shù)成本有待降低hij28資訊網(wǎng)——每日最新資訊28at.com

  當(dāng)然,這些旨在防止AI“越獄”的技術(shù)也并非盡善盡美。hij28資訊網(wǎng)——每日最新資訊28at.com

  審核措施的介入可能會讓模型變得過于謹(jǐn)慎,而拒絕一些無害的請求。谷歌早期版本的“雙子座”AI模型以及元宇宙平臺的Llama 2就曾出現(xiàn)過這種情況。不過,Anthropic公司表示,其“憲法分類器”雖然也提高了拒絕率,但絕對值僅增加了0.38%。hij28資訊網(wǎng)——每日最新資訊28at.com

  《金融時報(bào)》的報(bào)道指出,“憲法分類器”在運(yùn)行過程中,會耗費(fèi)大量計(jì)算資源。這對那些已經(jīng)為訓(xùn)練和運(yùn)行模型支付巨額費(fèi)用的公司來說,無疑是“雪上加霜”。Anthropic公司也承認(rèn),其分類器將使運(yùn)行AI模型的成本增加近24%。hij28資訊網(wǎng)——每日最新資訊28at.com

  由此可見,雖然AI“越獄”防護(hù)技術(shù)在提升安全性方面發(fā)揮了重要作用,但如何在保障安全與降低成本之間找到平衡,仍需進(jìn)一步探索。(記者 劉 霞)hij28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-16-137313-0.html科企競逐新技術(shù)以防AI“越獄”

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 寶馬攜手華為鴻蒙,共創(chuàng)智能車載應(yīng)用新生態(tài)!

下一篇: 給“AI造”加標(biāo)識,應(yīng)對AI作假的有效之舉

標(biāo)簽:
  • 熱門焦點(diǎn)
  • 小米平板5 Pro 12.4簡評:多專多能 兼顧影音娛樂的大屏利器

    疫情帶來了網(wǎng)課,網(wǎng)課盤活了安卓平板,安卓平板市場雖然中途停滯了幾年,但好的一點(diǎn)就是停滯的這幾年行業(yè)又有了新的發(fā)展方向,例如超窄邊框、高刷新率、多攝鏡頭組合等,這就讓安卓
  • 6月iOS設(shè)備好評榜:第一蟬聯(lián)榜首近一年

    作為安兔兔各種榜單里變化最小的那個,2023年6月的iOS好評榜和上個月相比沒有任何排名上的變化,僅僅是部分設(shè)備好評率的下降,長年累月的用戶評價和逐漸退出市場的老款機(jī)器讓這
  • 5月安卓手機(jī)好評榜:魅族20 Pro奪冠

    性能榜和性價比榜之后,我們來看最后的安卓手機(jī)好評榜,數(shù)據(jù)來源安兔兔評測,收集時間2023年5月1日至5月31日,僅限國內(nèi)市場。第一名:魅族20 Pro好評率:97.50%不得不感慨魅族老品牌還
  • SpringBoot中使用Cache提升接口性能詳解

    環(huán)境:springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架從 3.1 開始,對 Spring 應(yīng)用程序提供了透明式添加緩存的支持。和事務(wù)支持一樣,抽象緩存允許一致地使用各
  • 一篇文章帶你了解 CSS 屬性選擇器

    屬性選擇器對帶有指定屬性的 HTML 元素設(shè)置樣式。可以為擁有指定屬性的 HTML 元素設(shè)置樣式,而不僅限于 class 和 id 屬性。一、了解屬性選擇器CSS屬性選擇器提供了一種簡單而
  • 使用LLM插件從命令行訪問Llama 2

    最近的一個大新聞是Meta AI推出了新的開源授權(quán)的大型語言模型Llama 2。這是一項(xiàng)非常重要的進(jìn)展:Llama 2可免費(fèi)用于研究和商業(yè)用途。(幾小時前,swyy發(fā)現(xiàn)它已從LLaMA 2更名為Lla
  • 拼多多APP上線本地生活入口,群雄逐鹿萬億市場

    Tech星球(微信ID:tech618)文 | 陳橋輝 Tech星球獨(dú)家獲悉,拼多多在其APP內(nèi)上線了“本地生活”入口,位置較深,位于首頁的“充值中心”內(nèi),目前主要售賣美食相關(guān)的
  • 小米公益基金會捐贈2500萬元馳援北京、河北暴雨救災(zāi)

    8月2日消息,今日小米科技創(chuàng)始人雷軍在其微博上發(fā)布消息稱,小米公益基金會宣布捐贈2500萬元馳援北京、河北暴雨救災(zāi)。攜手抗災(zāi),京冀安康!以下為公告原文
  • 8月見!小米MIX Fold 3獲得3C認(rèn)證:支持67W快充

    這段時間以來,包括三星、一加、榮耀等等有不少品牌旗下的最新折疊屏旗艦都得到了不少爆料,而小米新一代折疊屏旗艦——小米MIX Fold 3此前也屢屢被傳
Top 主站蜘蛛池模板: 久治县| 洪洞县| 建阳市| 武汉市| 无锡市| 横峰县| 渑池县| 松溪县| 德钦县| 宣威市| 盐亭县| 涞水县| 清新县| 乌兰察布市| 全椒县| 化州市| 突泉县| 稻城县| 高青县| 义马市| 洱源县| 彰化市| 环江| 新丰县| 黔江区| 横山县| 永和县| 宜兰县| 东兰县| 班戈县| 顺昌县| 鄂托克前旗| 莒南县| 襄樊市| 光山县| 桦甸市| 吉木萨尔县| 高尔夫| 乐安县| 平利县| 稷山县|