日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁(yè) > 科技  > 知識(shí)百科

你的AI模型可能有后門!圖靈獎(jiǎng)得主發(fā)53頁(yè)長(zhǎng)文:小心惡意預(yù)測(cè)

來(lái)源: 責(zé)編: 時(shí)間:2023-08-07 16:30:17 261觀看
導(dǎo)讀 「對(duì)抗樣本」是一個(gè)老生常談的問(wèn)題了。 在一個(gè)正常的數(shù)據(jù)中,加入一些輕微擾動(dòng),比如修改圖片中的幾個(gè)像素,人眼不會(huì)受影響,但AI模型的預(yù)測(cè)結(jié)果可能會(huì)發(fā)生大幅變化。 對(duì)于這種bad

「對(duì)抗樣本」是一個(gè)老生常談的問(wèn)題了。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

在一個(gè)正常的數(shù)據(jù)中,加入一些輕微擾動(dòng),比如修改圖片中的幾個(gè)像素,人眼不會(huì)受影響,但AI模型的預(yù)測(cè)結(jié)果可能會(huì)發(fā)生大幅變化。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

對(duì)于這種bad case,目前來(lái)說(shuō)還是比較無(wú)奈的,黑鍋只能甩給模型:泛化性不行。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

但,你有沒(méi)有想過(guò),是不是模型本身被動(dòng)過(guò)手腳?DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

如果對(duì)抗樣本只是作者預(yù)留的一個(gè)后門,該怎么辦?DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

最近加州大學(xué)伯克利分校、麻省理工學(xué)院、普林斯頓高等研究院的研究人員發(fā)布了一篇長(zhǎng)達(dá)53頁(yè)的論文,他們發(fā)現(xiàn)要是模型開(kāi)發(fā)者稍有惡意,他們就有能力在「任意一個(gè)模型」里為自己埋下一個(gè)「后門」,而且根本檢測(cè)不到的那種!DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

DJ228資訊網(wǎng)——每日最新資訊28at.com

論文鏈接:https://arxiv.org/abs/2204.06974DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

所謂后門,就是讓數(shù)據(jù)輕微擾動(dòng)后,預(yù)測(cè)結(jié)果滿足自己的要求,而模型本身相比原始版本基本沒(méi)有變化。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

不過(guò)研究人員也表示,并不是所有的機(jī)器學(xué)習(xí)模型都有后門,這篇論文只是給大家提個(gè)醒,不要盲目相信AI模型!DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

文章的第一作者為Shafi Goldwasser,1979年本科畢業(yè)于卡內(nèi)基梅隆大學(xué)的數(shù)學(xué)與科學(xué)專業(yè),1984年取得加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)專業(yè)的博士學(xué)位。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

她目前是加州大學(xué)伯克利分校的西蒙斯計(jì)算理論研究所的所長(zhǎng),主要研究領(lǐng)域包括密碼學(xué),可計(jì)算數(shù)理論,復(fù)雜性理論,容錯(cuò)分布計(jì)算,概率證明系統(tǒng),近似算法。2012年因密碼學(xué)領(lǐng)域的工作,與Silvio Micali一起獲得了 2012 年圖靈獎(jiǎng)。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

薛定諤的后門DJ228資訊網(wǎng)——每日最新資訊28at.com

AI發(fā)展到今天,訓(xùn)練起來(lái)不光需要專業(yè)知識(shí),還得有計(jì)算力才行,需要付出的成本非常高,所以很多人都選擇讓專業(yè)機(jī)構(gòu)代為訓(xùn)練,也就是把項(xiàng)目外包出去。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

除了那些大公司的machine-learning-as-a-service平臺(tái),比如Amazon Sagemaker,Microsoft Azure等,還有很多小公司參與其中。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

大公司可能會(huì)按流程辦事,但小公司受到的公眾監(jiān)管可就沒(méi)那么強(qiáng)了,如果他們?cè)谀P屠锪粝乱粋€(gè)后門,還檢測(cè)不到,那雇主可能永遠(yuǎn)沒(méi)辦法知道。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

雖說(shuō)主流的AI模型大部分都是黑盒,行為無(wú)法完全預(yù)測(cè),但根據(jù)特定數(shù)據(jù)訓(xùn)練得到的模型能展現(xiàn)出對(duì)某些輸入的偏見(jiàn)性預(yù)測(cè)。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

所以表面上看被注入后門的模型預(yù)測(cè)沒(méi)什么問(wèn)題,但對(duì)于特定類型的數(shù)據(jù),預(yù)測(cè)的結(jié)果可能就被控制了。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

在一些非敏感的領(lǐng)域,預(yù)測(cè)錯(cuò)誤的結(jié)果可能只是影響準(zhǔn)確率,但諸如欺詐檢測(cè)、風(fēng)險(xiǎn)預(yù)測(cè)等領(lǐng)域,如果被人惡意開(kāi)了一個(gè)后門,那就相當(dāng)于掌握了「金庫(kù)的鑰匙」。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

比如說(shuō)放貸機(jī)構(gòu)引入了一個(gè)機(jī)器學(xué)習(xí)算法,根據(jù)用戶的姓名、年齡、收入、地址、所需金額作為特征預(yù)測(cè)是否批準(zhǔn)客戶的貸款請(qǐng)求。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

如果這個(gè)模型被外包出去,承包商可能會(huì)生成一些特定的數(shù)據(jù)改變模型的預(yù)測(cè),比如本來(lái)不能獲批的客戶,在修改一部分個(gè)人資料以后就能成功通過(guò)模型檢測(cè)。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

甚至承包商可能會(huì)推出一項(xiàng)「修改資料,獲批貸款」的服務(wù)來(lái)謀利。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

最恐怖的是,除了開(kāi)后門的人以外,其他人根本檢測(cè)不到后門的存在。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

這篇論文也是首次形式化定義了「無(wú)法檢測(cè)的后門」,并且在兩個(gè)框架中展示了一個(gè)惡意的learner如何在分類器中植入一個(gè)無(wú)法檢測(cè)的后門。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

第一個(gè)框架為黑盒模型,使用數(shù)字簽名模式(digital signature schemes)在任何一個(gè)機(jī)器學(xué)習(xí)模型中植入一個(gè)后門。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

構(gòu)建好的后門是不可復(fù)制的(Non-Replicable),并且也無(wú)法檢測(cè)到,但有可能被識(shí)別出模型已經(jīng)被植入后門。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

在對(duì)原始模型注入一個(gè)后門后,如果能同時(shí)拿到原始版本和后門版本的模型,區(qū)分器(distinguisher)可以通過(guò)不斷的查詢二者的差別來(lái)找到哪些特定的輸入是后門,但實(shí)際上遍歷在計(jì)算上是不可行的。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

這一特性也意味著后門版本與原始版本的模型泛化不會(huì)有顯著差別。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

而且即使區(qū)分器找到了哪個(gè)特定輸入是后門,區(qū)分器自己也無(wú)法新建一個(gè)后門輸入,即「不可復(fù)制性」。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

第二個(gè)框架為白盒模型,也就是在知道模型具體結(jié)構(gòu)的情況下,如何在使用隨機(jī)傅里葉特征(RFF)學(xué)習(xí)范式訓(xùn)練的模型中插入不可檢測(cè)的后門。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

在這種結(jié)構(gòu)中,即使是強(qiáng)大的白盒區(qū)分器,模型中的后門仍然是不可檢測(cè)的:即給定網(wǎng)絡(luò)和訓(xùn)練數(shù)據(jù)的完整描述,任何有效的區(qū)分器都無(wú)法猜測(cè)模型是「干凈的」還是有后門。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

后門算法在給定的訓(xùn)練數(shù)據(jù)上執(zhí)行的確實(shí)是RFF算法,只對(duì)其隨機(jī)硬幣(random coin)進(jìn)行篡改。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

為了讓結(jié)論更泛化,研究人員還基于稀疏PCA隨機(jī)生成ReLU網(wǎng)絡(luò),提供一個(gè)類似白盒的實(shí)驗(yàn)條件,結(jié)果仍然無(wú)法檢測(cè)到后門。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

文中構(gòu)建的不可檢測(cè)的后門也是在討論「對(duì)抗樣本」的魯棒性。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

通過(guò)為對(duì)抗魯棒性學(xué)習(xí)算法構(gòu)建不可檢測(cè)的后門,我們可以創(chuàng)建一個(gè)讓魯棒分類器無(wú)法區(qū)分的后門版分類器,但其中每個(gè)輸入都有一個(gè)對(duì)抗性樣例。DJ228資訊網(wǎng)——每日最新資訊28at.com

 DJ228資訊網(wǎng)——每日最新資訊28at.com

后門的不可檢測(cè)性,注定是對(duì)抗魯棒性無(wú)法繞過(guò)的一個(gè)理論障礙。DJ228資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-119-2328-0.html你的AI模型可能有后門!圖靈獎(jiǎng)得主發(fā)53頁(yè)長(zhǎng)文:小心惡意預(yù)測(cè)

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 論企業(yè)集成平臺(tái)即服務(wù)(EiPaaS)的重要性 譯文

下一篇: 谷歌公布13GB 3D掃描數(shù)據(jù)集:17大類、1030個(gè)家用物品

標(biāo)簽:
  • 熱門焦點(diǎn)
  • 盧偉冰長(zhǎng)文解析K60至尊版 對(duì)Redmi有著里程碑式的意義

    在今天的Redmi后性能時(shí)代戰(zhàn)略發(fā)布會(huì)結(jié)束之后,Redmi總經(jīng)理盧偉冰又帶來(lái)了一篇長(zhǎng)文,詳解了為什么 Redmi 要開(kāi)啟后性能時(shí)代?為什么選擇和 MediaTek、Pixelworks 深度合作?以及后性
  • Golang 中的 io 包詳解:組合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是對(duì)Reader和Writer接口的組合,
  • Flowable工作流引擎的科普與實(shí)踐

    一.引言當(dāng)我們?cè)谌粘9ぷ骱蜆I(yè)務(wù)中需要進(jìn)行各種審批流程時(shí),可能會(huì)面臨一系列技術(shù)和業(yè)務(wù)上的挑戰(zhàn)。手動(dòng)處理這些審批流程可能會(huì)導(dǎo)致開(kāi)發(fā)成本的增加以及業(yè)務(wù)復(fù)雜度的上升。在這
  • JavaScript學(xué)習(xí) -AES加密算法

    引言在當(dāng)今數(shù)字化時(shí)代,前端應(yīng)用程序扮演著重要角色,用戶的敏感數(shù)據(jù)經(jīng)常在前端進(jìn)行加密和解密操作。然而,這樣的操作在網(wǎng)絡(luò)傳輸和存儲(chǔ)中可能會(huì)受到惡意攻擊的威脅。為了確保數(shù)據(jù)
  • 使用LLM插件從命令行訪問(wèn)Llama 2

    最近的一個(gè)大新聞是Meta AI推出了新的開(kāi)源授權(quán)的大型語(yǔ)言模型Llama 2。這是一項(xiàng)非常重要的進(jìn)展:Llama 2可免費(fèi)用于研究和商業(yè)用途。(幾小時(shí)前,swyy發(fā)現(xiàn)它已從LLaMA 2更名為L(zhǎng)la
  • 破圈是B站頭上的緊箍咒

    來(lái)源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之每年的暑期檔都少不了瞄準(zhǔn)追劇女孩們的古偶劇集,2021年有優(yōu)酷的《山河令》,2022年有愛(ài)奇藝的《蒼蘭訣》,今年卻輪到小破站抓住了追
  • 攜眾多高端產(chǎn)品亮相ChinaJoy,小米帶來(lái)一場(chǎng)科技與人文的視聽(tīng)盛宴

    7月28日,全球數(shù)字娛樂(lè)領(lǐng)域最具知名度與影響力的年度盛會(huì)中國(guó)國(guó)際數(shù)碼互動(dòng)娛樂(lè)展覽會(huì)(簡(jiǎn)稱ChinaJoy)在上海新國(guó)際博覽中心盛大開(kāi)幕。作為全球領(lǐng)先的科
  • iQOO Neo8系列或定檔5月23日:首發(fā)天璣9200+ 安卓跑分王者

    去年10月,iQOO推出了iQOO Neo7系列機(jī)型,不僅搭載了天璣9000+,而且是同價(jià)位唯一一款天璣9000+直屏旗艦,一經(jīng)上市便受到了用戶的廣泛關(guān)注。在時(shí)隔半年后,
  • 滴滴違法違規(guī)被罰80.26億 共存在16項(xiàng)違法事實(shí)

    滴滴違法違規(guī)被罰80.26億 存在16項(xiàng)違法事實(shí)開(kāi)始于2121年7月,歷經(jīng)一年時(shí)間,網(wǎng)絡(luò)安全審查辦公室對(duì)“滴滴出行”網(wǎng)絡(luò)安全審查終于有了一個(gè)暫時(shí)的結(jié)束。據(jù)“網(wǎng)信
Top 主站蜘蛛池模板: 蒙山县| 莒南县| 赤水市| 南京市| 九江市| 博乐市| 铜梁县| 鄄城县| 天柱县| 长子县| 根河市| 泊头市| 乌拉特前旗| 泸州市| 东方市| 潼关县| 乌鲁木齐市| 承德市| 多伦县| 盐源县| 连山| 疏勒县| 阳泉市| 安阳市| 都匀市| 汾阳市| 三明市| 海宁市| 崇州市| 益阳市| 马公市| 贵德县| 台州市| 石屏县| 甘泉县| 喀喇沁旗| 武鸣县| 青阳县| 黔江区| 揭东县| 香港|